6月のマルレク「AIとグラフ」講演ビデオと講演資料を公開しました
【 6月の マルレク「AIとグラフ」講演ビデオと講演資料を公開しました。 】 MaruLaboでは、定期的に以前行ったセミナーのコンテンツを公開しています。 今回公開したのは、2024年6月29日に開催したマルレク「AIとグラフ」のコンテンツです。 6月の マルレク「AIとグラフ」は、次のような構成をしています。 ⚫️ Part 1 「画像とグラフの違いを考える」 ⚫️ Part 2 「グラフの認識の難しさ」 ⚫️ Part 3 「AIのAgent Model のグラフ表現 以下、それぞれのパートの概要を紹介し、あわせて、事後になりますが、それらについての自分のコメント( * に続く部分)を補足したいと思います。 【 Part 1 「画像とグラフの違いを考える」概要とコメント 】 このパートで扱っているのは、現在のマルチ・モーダルを指向するAI技術には、得意とする領域と不得意とする領域があるという問題です。 GPT4oのDall.E を用いたテキストからの画像生成能力は、素晴らしいものです。また、画像としてのグラフの認識は、時々、ハルシネーションを起こしますが、グラフのノードとエッジのラベルを理解し、グラフの隣接行列を構成できるほど高度です。 ただ、グラフの画像の出力に、Dall.Eは向いていません。出力されたグラフの画像は、彼が理解しているグラフの特徴を反映していないし、あるいは、反映させることができないように見えます。 *「画像」という同じ言葉で括られていても、我々が直接的に「見る世界」に存在する視覚に与えられる情報に基本的には還元される一般的な画像(写真や絵画のような)と、グラフの画像のように視覚情報を通じて与えられるにせよその背後にある数学的に規定されている特徴の抽出を必要とする数学的イメージとは、認識の対象として存在のありかたが異なります。Diffusion model にはそうした区別はありません。数学的対象は、視覚によって捉えられるわけではありません。 * 画像生成技術の「成功」は、基本的には、Diffusion modelの成功によってもたらされたものです。ただ、実際のAIによる画像生成は、生成AIが得意とする言語情報を利用する能力(それは数学的な対象を認識する能力とは異なるものです)によって強く「補完」され、さらに、その生成は生成AIが