DreamerV3の何が画期的なのか?
【 DreamerV3の何が画期的なのか? 】
DreamerV3は、昨今話題のAI Agentの一種です。ただ、このAI Agentは、皆さんの身近にいる「コードを書いてくれる」 AI Agentとは、一味違っています。
前回のセッションでは、DreamerV3を「ゲームをするAI Agent」として紹介してきました。それだけでは彼が可哀想です。
今回のセッションでは、なぜ、この「ゲームをするAI Agent」が「コードを書いてくれるAI Agent」以上に画期的なのかを考えてみたいと思います。
【 視点を切り替えよう 】
ひたすらゲームをするだけのAIが、コードを書いてくれるAIより「画期的」だと思うには、視点の切り替えが必要かもしれません。
それは、簡単なことです。我々がAIに何を期待しているのかを改めて考えること、一言で言えば、AIを作る人の視点を持つことです。そのためには、AIを作るとか何かのAIのプロジェクトに参加する必要はありません。そうした視点を「想像」するだけで十分です。
技術が関わる世界には、その技術を使う人とその技術を作る人がいます。IT技術者は、これまでは、技術を作る側の一端に立っていました。ただ、AI技術に関しては、IT技術者は最も熱心なAI技術の利用者になろうとしています。ひたすらAIを使うだけだと、IT技術者にとっては、あまりいいことないと僕は思います。
実は、「想像」は、夢見るDreamerV3のキーワードの一つです。
【 世界のモデルと未来を想像する力】
DreamerV3の基本的な論文のタイトルは、”Mastering diverse control tasks through world models”です。「多様な制御タスクを世界モデルを通じてマスターする」
世界モデルってなんでしょう?この論文に、とても印象的な一節があります。
"The algorithm is based on the idea of learning a world model that equips the agent with rich perception and the ability to imagine the future"
「このアルゴリズムは、エージェントに豊かな知覚と未来を想像する能力を付与する世界のモデルを学習するというアイデアに基づいている」
皆さんの身近で働いているAI Agentは、 「世界」のことを知る(たとえ、それがゲームの画面上のバーチャルな世界だとしても)「豊かな知覚」を持っていますか?
あなたのAI Agentは、「知覚」を持ちません。それは、RAGで拡張されたLLMが管理する文字情報の世界で生きています。
皆さんのAI Agentは、「未来を想像する」能力を持っていますか?多分、ないと思います。もしもあったとしても、それは「ハルシネーション」と呼ばれるでしょう。
幸いなことに、現時点では、我々がどのようなAIを構想するかによって、AIはその未来の姿を変えます。DreamerV3が、「画期的」なのは、まず、そのアイデアにあると、僕は考えています。
【 AIの中に「世界のモデル」を作る 】
重要なのは、AIの内部に「世界のモデル」 -- DreamerV3は、これをworld modelと呼んでいます -- を作るというアイデアです。
minecraftの場合には、ゲームのピクセル画面を取り込んで、autoencoderで圧縮して、その圧縮した画像情報を自分の内部に時系列順に記憶していきます。
単に「世界」の画像情報を取り込むだけだったら、それは、ビデオ・デッキや監視カメラのメモリーと変わりありません。
DreamerV3は、world model をRNNのニューラル・ネットワークとして構築します。このworld model ニューラル・ネットワークは、例えば、5フレームの画像データを受け取ると、その5フレームの情報のみを元にして45フレームの画像データを生成します。
このworld modelが5フレームの現実の画像データから生成した45フレームの画像データが、DreamerV3が「想像」した「未来」の世界なのです。
【 今回と次回ののセッションが取り上げること 】
今回のセッションは、DreamerV3の最大の特徴ともいうべき その world model について説明しています。詳しくは、ビデオあるいはpdfファイルをご覧ください。
次回は、AI技術の発展の中で、「世界のモデル」がどのように扱われてきたかを振り返ってみようと思います。
ウィノグラードの「積み木の世界」と、ロドニー・ブルックスの「世界の内部モデル不要論」を紹介します。
−−−−-−−−-−−−−-−−−−−−−−-
blog page
https://maruyama097.blogspot.com/2025/06/dreamerv3.html
マルレク「AI とマインクラフトの世界」まとめページ
https://www.marulabo.net/docs/dreamerv3/
マルレク「AI とマインクラフトの世界」のショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNT-iHwnkWJ5379ztVAbatX
ショートムービー「 DreamerV3の何が画期的なのか? 」のpdf
https://drive.google.com/file/d/1r16l_qKecDlxoDfvJCLIbrzOFycw0cY6/view?usp=sharing
ショートムービー「DreamerV3の何が画期的なのか?」
https://youtu.be/17Gne8DXZkw?list=PLQIrJ0f9gMcNT-iHwnkWJ5379ztVAbatX
https://youtu.be/17Gne8DXZkw?list=PLQIrJ0f9gMcNT-iHwnkWJ5379ztVAbatX
コメント
コメントを投稿