人工的な好奇心により、このボットはモンテスマの復讐に勝利することができます

1984年に最初に登場したとき、モンテスマの復讐はゲーム機に登場する最も挑戦的なビデオゲームの1つと見なされていました。現在、機械学習をより効率的に支援するために、AI研究者は、この古典的なビデオゲームのヒーローをいくつかの非常に重要な方法で実際に動機付けるアルゴリズムを作成しました。これは驚くほど効果的です。

モンテスマのリベンジをプレイしたことがある人なら誰でも、このゲームが実際にどれほど苛立たしいものになるかを知っています。新しい研究の著者は、このように課題を説明しています。

このビンテージゲームは、人工知能は言うまでもなく、人間のプレイヤーにとっては難しいものです。現在まで、AIがわずかなパフォーマンスレベルを達成するには数億の個別フレームが必要であり、せいぜい72のうち2つまたは3つの部屋しかクリアできません。

GoogleのDeepMind部門は、かなり前からモンテスマの復讐を解決しようとしてきました。昨年、Google 、Deep Qシステムが、ビデオゲームのプレイ方法を見るだけで、49のAtariゲームを打ち負かすことができると発表しました。しかし、モンテスマの復讐はまったく別の課題を提示します。以下のように報告された有線時点で、ディープQは得点、ゲームの進展のあらゆる種類のできなかった「大きな脂肪ゼロを。」問題は、先の尖ったアウトようでデイブGershgornによってポピュラーサイエンス、このゲームで成功するためには、「選手たちは部屋をオフにして、その計画を実行する方法を計画する必要があります。」ということです

そのために、そしてモンテスマの復讐で少なくとも部分的に成功できるエージェントを最終的に作成するという最新の取り組みにおいて、DeepMindの研究者はパナマジョーにいわゆる「本質的な動機」を与えました。

基本的に、私たちのデジタルアドベンチャーの主人公は、人間と同じように各レベルを解決するように訓練されており、ノベルティベースの報酬を使用して行われます。パナマジョーは、ゲームに勝つだけでなく、ゲームをもっと探求することにも「やる気」があります。それぞれのエピソードで、彼は何か違うことを試みます、そしてこれはしばしば新しい解決策と最終的に成功を生み出します。

もちろん、ジョーは人間のプレイヤーのように実際には自己認識していません。むしろ、彼は一連のデジタル報酬を通じてインセンティブを与えられています。これは、ほんの数例から、彼がより速く学ぶのに役立ちます。

一例(上のビデオに表示)では、パナマジョーは実際にわずか4回の試行でレベル全体を解決することができます。そして、このいわゆる人工的な好奇心の有無にかかわらずプログラムされたエージェントの比較分析では、本質的に動機付けられたジョーは24のうち15の部屋を探索しましたが、動機付けのないジョーは2つだけを探索しました。

いわゆるアーケード学習環境でこのように作業することにより、研究者は現実の世界に適用できるアルゴリズムを作成することを望んでいます。将来的には、同様の動機が、ロボットやその他の自律型デバイスが同様の方法で世界をナビゲートおよび探索するのに役立つ可能性があります。

[ポピュラーサイエンス経由のarXiv ]

提案された投稿

司法省は、反トランプのFacebookページを「気に入った」人々の名前の要求を取り下げます

司法省は、反トランプのFacebookページを「気に入った」人々の名前の要求を取り下げます

写真:ゲッティ本日の法廷審問で、司法省は、就任式の抗議についてFacebookページを「気に入った」と推定される6,000人の名前の要求を取り下げたとアメリカ自由人権協会は述べた。ACLUは、金曜日のトランプ大統領の就任に対する抗議に関連するいくつかの令状に異議を唱えました。そのうちの1つには、捜査が含まれており、それらは広すぎると主張しました。

ニキシー管の美しい作り方を深く掘り下げましょう

ニキシー管の美しい作り方を深く掘り下げましょう

ニキシー管は地獄のように涼しいだけでなく、このビデオは私が考えることができるあなたの朝を始めるための最もリラックスした方法です。ニキシー管は、主に文字や数字を表示するために使用されていた昔ながらのデバイスです。

関連記事

Waymoは主要な法的勝利を獲得し、元従業員の一部について作成された超秘密ファイルを見ることができます

Waymoは主要な法的勝利を獲得し、元従業員の一部について作成された超秘密ファイルを見ることができます

写真:Googleからスピンアウトした自動運転車会社のGetty Waymoは、進行中のUberとの法廷闘争で大勝利を収めました。Waymoは、元Waymoの従業員が自動運転車の技術に関する企業秘密を盗み、Uberに持ち込み、そこでUberが自社の車に組み込んだと主張して、配車サービス会社を訴えています。

この小さなロボットはボウリングレーンをきれいにするための最良の方法です

この小さなロボットはボウリングレーンをきれいにするための最良の方法です

ボウリングレーンがどのように光沢があり、きれいなままであるのか疑問に思ったことはありませんか?残念ながら、KegelKustodianという名前に感謝することができます。大きな間抜けなスーツケースのように見えますが、ケーゲルはかなり賢いです。

一流の専門家がAI兵器の禁止を求める公開書簡に署名

一流の専門家がAI兵器の禁止を求める公開書簡に署名

1000人以上の著名な思想家と主要なAIおよびロボット工学の研究者が、「意味のある人間の制御を超えた攻撃的な自律型兵器」の禁止を求める公開書簡に署名しました。この書簡は、Future of LifeInstituteによって最近まとめられました。アルゼンチンのブエノスアイレスで開催された人工知能に関する国際合同会議。

最もクールなAppleWatch機能はサイレントで、目に見えず、65年前のものです

最もクールなAppleWatch機能はサイレントで、目に見えず、65年前のものです

Apple Watchの予約注文の初日に、私は15,000ドルの腕時計を身に付けて、それが何が特別なのかを理解しようとしました。確かに、鈍い方法で印象的な純金のケーシングがありました。

MORE COOL STUFF

「リチャード王」の背後にある実話と映画が間違っていたもの:金星とセリーナウィリアムズの姉妹の重さ

「リチャード王」の背後にある実話と映画が間違っていたもの:金星とセリーナウィリアムズの姉妹の重さ

「キング・リチャード」は、いくつかの例外を除いて、ほぼ毎日、ヴィーナスとセリーナ・ウィリアムズの父親の実話に固執しています。

「誰もがレイモンドを愛している」:ファンは、マリー・バロンがデブラ・バロンを嫌う理由についての理論を持っています

「誰もがレイモンドを愛している」:ファンは、マリー・バロンがデブラ・バロンを嫌う理由についての理論を持っています

「EverybodyLovesRaymond」のファンは、バロン家の機能不全に喜んでいたかもしれませんが、マリー・バロンは大家族の秘密を守っていましたか?

「ハリーポッター」スターダニエルラドクリフは生意気な別れの贈り物ルパートグリントが彼に与えたことを明らかにします

「ハリーポッター」スターダニエルラドクリフは生意気な別れの贈り物ルパートグリントが彼に与えたことを明らかにします

2005年に最後の「ハリーポッター」映画がラップされたとき、ルパート・グリントは彼の共演者ダニエル・ラドクリフにかなり奇妙な別れの贈り物を贈りました。

「ゲーム・オブ・スローンズ」:ほとんどのエピソードに登場した俳優はどれですか?

「ゲーム・オブ・スローンズ」:ほとんどのエピソードに登場した俳優はどれですか?

ゲーム・オブ・スローンズのファンは、ほとんどのエピソードに登場する俳優を追跡するのが難しいと感じています。彼らはドラマとサスペンスに巻き込まれています。

ミニクロスワードをお試しください

ミニクロスワードをお試しください

毎週更新される私たちのミニクロスワードは、私たちのお気に入りのハウスタッフワークスの読みと頭のいい手がかりを組み合わせています!

どれが最も効果的ですか:洗濯ポッド、粉末または液体洗剤?

どれが最も効果的ですか:洗濯ポッド、粉末または液体洗剤?

適切な洗剤を選ぶことを心配することなく、洗濯をすることは十分に悪いことです。では、どちらが最適ですか?それとも重要ですか?

ケンタッキーの青い人々の実話

ケンタッキーの青い人々の実話

ケンタッキー州の田舎に住むFugatesとCombsの家族は、遺伝的宝くじを失いました。どちらも、結婚するにつれて肌が青く見える、まれな劣性形質を共有していました。これの原因は何でしたか?そして、家族はどうなりましたか?

カリフォルニアコンドルの「バージンバース」は種を救うことができますか?

カリフォルニアコンドルの「バージンバース」は種を救うことができますか?

カリフォルニアコンドルを絶滅から救うためのプログラムで、2羽の父親のいないオスのヒナが飼育されています。そのような「処女」の誕生はどのように可能ですか?

サタデーナイトライブコメディアン兼作家ピーターエイクロイドデッド66歳

サタデーナイトライブコメディアン兼作家ピーターエイクロイドデッド66歳

俳優のダンエイクロイドの兄弟であるピーターエイクロイドは、1979年のサタデーナイトライブの1シーズンで作家とキャストの両方のメンバーを務めました。

「攻撃的な癌」の診断後、ジョー・エキゾティックがノースカロライナ州の医療施設に移送された

「攻撃的な癌」の診断後、ジョー・エキゾティックがノースカロライナ州の医療施設に移送された

タイガーキングスターのジョセフ 'ジョーエキゾティック'マルドナド-パッセージは当初、彼の前立腺癌の診断を明らかにした後、今月後半に移管されることになっていた

CardiBとOffsetのDaughterKultureがInstagramで美しい新しいブレードを披露

CardiBとOffsetのDaughterKultureがInstagramで美しい新しいブレードを披露

Cardi BとOffsetの3歳の娘、Kultureは、Instagramで彼女の新しい編みこみのヘアスタイルを披露しました。

投資知識とシルバーサーファー

投資知識とシルバーサーファー

マーベルの「ヘラルド・オブ・ガラクタス」が投資の専門知識の向上にどのように役立つか「私は勝利の激しい高揚を知っています。私は敗北のかじる痛みを知っています。

私は外側が白ですが、ずっと黒です。

私は外側が白ですが、ずっと黒です。

「オレオ」は、私の家族が肌の色を裏切った黒人と呼んでいたものです。彼らは外見は黒く見えるかもしれないが、その行動は彼らが内面が白であることを示したものでした。

デジタルアクセシビリティ入門

デジタルアクセシビリティ入門

従来、これは障害を持つ人々のアクセシビリティと考えられていましたが、実際には、モバイルデバイスを使用したり、ネットワークへの接続が遅い他のユーザーグループも含まれます。このシリーズの記事では、コース、記事、ビデオレクチャーなど、さまざまなソースからの情報を体系化して、このトピックをできるだけ広くカバーするようにしました。これは、包括的なイベントであり、公開するのは非常に間違っているためです。デジタル製品の1つ以上のステージのみ。

実践的な強化学習コース—パート1

実践的な強化学習コース—パート1

ゼロからヒーローまで、一歩一歩。私の強化学習コースへようこそ!❤️Pythonのコーディング例とチュートリアルを一緒に使用して、基礎から最先端の強化学習(RL)までのこの美しいパスをステップバイステップで歩きましょう!この最初の部分では、この旅に着手するために必要な最低限の概念と理論について説明します。

Language