6月のマルレク「AIとグラフ」講演ビデオと講演資料を公開しました
【 6月の マルレク「AIとグラフ」講演ビデオと講演資料を公開しました。 】
MaruLaboでは、定期的に以前行ったセミナーのコンテンツを公開しています。
今回公開したのは、2024年6月29日に開催したマルレク「AIとグラフ」のコンテンツです。
6月の マルレク「AIとグラフ」は、次のような構成をしています。
⚫️ Part 1 「画像とグラフの違いを考える」
⚫️ Part 2 「グラフの認識の難しさ」
⚫️ Part 3 「AIのAgent Model のグラフ表現
以下、それぞれのパートの概要を紹介し、あわせて、事後になりますが、それらについての自分のコメント( * に続く部分)を補足したいと思います。
【 Part 1 「画像とグラフの違いを考える」概要とコメント 】
このパートで扱っているのは、現在のマルチ・モーダルを指向するAI技術には、得意とする領域と不得意とする領域があるという問題です。
GPT4oのDall.E を用いたテキストからの画像生成能力は、素晴らしいものです。また、画像としてのグラフの認識は、時々、ハルシネーションを起こしますが、グラフのノードとエッジのラベルを理解し、グラフの隣接行列を構成できるほど高度です。
ただ、グラフの画像の出力に、Dall.Eは向いていません。出力されたグラフの画像は、彼が理解しているグラフの特徴を反映していないし、あるいは、反映させることができないように見えます。
*「画像」という同じ言葉で括られていても、我々が直接的に「見る世界」に存在する視覚に与えられる情報に基本的には還元される一般的な画像(写真や絵画のような)と、グラフの画像のように視覚情報を通じて与えられるにせよその背後にある数学的に規定されている特徴の抽出を必要とする数学的イメージとは、認識の対象として存在のありかたが異なります。Diffusion model にはそうした区別はありません。数学的対象は、視覚によって捉えられるわけではありません。
* 画像生成技術の「成功」は、基本的には、Diffusion modelの成功によってもたらされたものです。ただ、実際のAIによる画像生成は、生成AIが得意とする言語情報を利用する能力(それは数学的な対象を認識する能力とは異なるものです)によって強く「補完」され、さらに、その生成は生成AIが従う「倫理コード」によって完全にコントロールされ「検閲」されているように見えます。そうした現象については、今回の情報公開では詳しく触れられませんでした。興味ある方は、ショートムービー「Interlude -- 「GPT4と遊ぶ」 画像生成を振り返る」をご覧ください。
https://youtu.be/j0poidf6yb4?list=PLQIrJ0f9gMcPpoVVdnlz0n_dCoT2vl9p9
【 Part 2 「グラフの認識の難しさ」概要とコメント 】
このPart 2では、マルチ・モーダルな生成AIのグラフ画像出力のトピックをいったん離れて、グラフの認識の難しさについて、複雑性理論の観点から考えています。
前段のPart 1で見てきた GPT4o のグラフ出力(正確に言えば、グラフ画像出力)への不満は、出力されたグラフが我々が期待していたグラフとは違っていたということです。では、どのようなグラフの出力だったら、我々は満足したのでしょうか?多分、「我々が期待したグラフと出力されたグラフが「同じ」だったら問題ないけど、あの出力は「違う」グラフだった」と答えるでしょう。
それでは、二つのグラフが「同じ」とは、どういうことなのでしょうか? このPart 2では、二つのグラフが「同じ」だということ -- 数学的には、二つのグラフは「同型」であるというのですが、グラフの「同型性」について考えることから始めています。
二つのグラフが「同じ」であるかを判断することは、自明の判断のように思われるかもしれませんが、実は、そうではないのです。それは数学的にもとても難しい問題なのです。
このPart 2 では、こうした認識が比較的新しいもので、かつその認識が「計算複雑性理論」を新しい水準に引き上げるきっかけになったことを述べています。そうした認識を可能にした「対話型証明」という新しい証明手法の紹介が Part 2の主要なコンテンツです。
「対話型証明」は、現代の数学観をまったく新しいものに変えました。
* 「対話型証明」には、「なんでも知っているが、時々ウソをつく」という「全能の証明者」という存在が登場します。「それは以前は奇妙な想定と感じられていたのだが、でも、それは今のAIが果たしている役割に似ていないか?」という指摘に、セミナー全体で一番の反応がありました。「対話型証明」の一番重要な特徴は、「全能者」の言うことを盲信せず、自分の頭で「全能者」の主張を検証しようとする「検証者」の存在なのですが、そのことにも共感があったように思います。AIの時代が、かつてはその理解が容易ではなかった「対話型証明」という最先端の数学的手法を多くの人が理解する環境を作り出しているのは興味深いことです。
* グラフの数学的特徴づけも、単純なものから数学的に精緻なものまでいろいろな段階があります。グラフを描画するグラフ・ライブラリーにもいろいろなものがあるのですが、それらをグラフの数学的特徴づけのレベルに応じて分類することができます。おおまかに言うと、こうしたレベルによって、グラフ・ライブラリーの進化をあとづけることができます。こうした議論は、「AIとグラフ」の第二部である、7月のマルレク「コンピュータ上のグラフ理論の進化 -- AIとグラフ2」で取り上げられています。次のまとめページを参照ください。
https://www.marulabo.net/docs/ai-graph2/
【 Part 3 「AIのAgent Model のグラフ表現」概要とコメント 】
グラフの問題は、生成AIの華々しい成功に比べると、小さなスキマでいずれなんとかなると感じている人も多いと思います。
ただ、僕は、現在のAIの能力の基本的な問題の一つは、我々は、グラフをはじめとする数学的な対象の特殊な性格をAIの能力に組み込むことにまだ成功していないところにあると考えています。グラフの問題は、そのひとつの表れで、それは、見かけ以上に「大きなスキマ」なのだと僕は感じています。
現在の生成AI技術の発展 – マルチモーダル化、複数のAI システムの利用、分散化、クライアント化、AIと人間の接点の急速な拡大 – といった変化の中で、さまざまな「すきま」が自覚されそうした「すきま」に対応しようと言う問題意識が広がっています。
Part 3 では、こうしたAIの機能拡大の動きを「AIのAgent Model」への変化として捉える視点を紹介しています。具体的には、次のような取り組みをAIの能力拡大をめざすAgent Model として取り上げています。
<< AIの能力拡大とAgentモデル >>
⚫️ フォン・ノイマンの「自己複製機械」
⚫️ RAG ( Retrieval-Augmented Generation )
⚫️ ATM ( Adversarial Tuning Multi-agent system )
⚫️ AgentGym
* パラメータの配備が終わった生まれたままの大規模言語モデルは、ユーザーとのやり取り以外に「外部」との接点を持ちません。また、そのままのスタイルでは、大規模言語モデルはユーザーとの会話から学習することをしません。それは「外部」を持たないのです。
* そうした自律的で自己完結的なあり方は、ある意味では数学的なモデルに似ているところがあります。もっとも、数学論では数学は外部の物理世界の論理を「反映する」という議論があります。もっと別の形では、情報過程=物理過程というという認識が基本的で、それが数学的認識を教会づけていると言う議論もあります。
後者の議論については、9月のマルレク「計算複雑性理論入門 -- -- Turingマシンから量子コンピュータまで」のChurch-Turing Thesis の歴史的発展についての議論を参照ください。https://www.marulabo.net/docs/computer-math2/
* AIの世界でのAgent Model への関心の高まりは、基本的には、AIの外側に言語情報の蓄積に還元され得ない豊かな世界が広がっていることを、AIに教える必要があるという具体的なニーズに対応しています。AIに明確な「外部性」の認識を持たせることが必要なのだと思います。
==================
セミナーの公開情報(この文書です)は、こちらからアクセスできます。https://maruyama097.blogspot.com/2024/11/6ai.html
公開されたセミナーは3つのパートに分かれています。個別にも全体を通してもアクセスできます。
--------------------------
全体を通して見る
--------------------------
● 「AIとグラフ」セミナーの講演ビデオ全体の再生リストのURLです。
全体を通して再生することができます。
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNh55bPi6AdHDHkfBmmK7mk
● 講演資料全体を一つのpdfファイルにまとめたものはこちらです。
「AIとグラフ 」講演資料
https://drive.google.com/file/d/1SHyd1ZN268E7ABJQAzS9RlRdzB6SczMk/view?usp=sharing
--------------------------
パートごとに見る
--------------------------
● Part 1 画像とグラフの違いを考える
講演ビデオURL :
https://youtu.be/EVm_hiMP4-w?list=PLQIrJ0f9gMcNh55bPi6AdHDHkfBmmK7mk
講演資料 pdf
https://drive.google.com/file/d/1SQuD1UDVcHEMWVKxASNNeWoasM9_U8p2/view?usp=sharing
● Part 2 グラフの認識の難しさ
講演ビデオURL :
https://youtu.be/ZiEZjZ8r9-I?list=PLQIrJ0f9gMcNh55bPi6AdHDHkfBmmK7mk
講演資料 pdf
https://drive.google.com/file/d/1ST5YB7wBtD1cXhwKgqy6aBA15ZjisG3L/view?usp=sharing
● Part 3 AIのAgent Model
講演ビデオURL :
https://youtu.be/VpY21XKcKT8?list=PLQIrJ0f9gMcNh55bPi6AdHDHkfBmmK7mk
講演資料 pdf :
https://drive.google.com/file/d/1SWYhuM9xxr_7yBMVnCa8d3WaVcJxom44/view?usp=sharing
-----------------------------
今回のセミナーのまとめページはこちらです。
「 AIとグラフ 」
https://www.marulabo.net/docs/ai-graph/
セミナーに向けたショートムービーの再生リストはこちらです。ご利用ください。
「 AIとグラフ 」
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcPpoVVdnlz0n_dCoT2vl9p9
---------------------------
コメント
コメントを投稿