6月のマルレク「GPT-4 との対話 -- プロンプトで遊ぶ」の講演資料と講演ビデオを公開しました

9月 03, 2023

【 6月のマルレク「GPT-4 との対話 -- プロンプトで遊ぶ」の講演資料と講演ビデオを公開しました】

「生成AI」技術が、多くの人に驚きを与えたのは、それが人間のみが持つと考えられていたことばを自在に操る能力をコンピュータが獲得したことを示したことにあると僕は考えています。それは、人工知能技術の発展の中でも特筆すべき画期的な達成です。　

このセミナーで、僕が取り上げることは、おそらく多くの人の関心の高い、その技術の実践的な応用の可能性でもその技術の社会的インパクトでもありません。また、両者の「折り合い」をどうつけるかを考えることでもありません。

僕が、このセミナーでやってみたいと思ったことは、コンピュータ＝機械の言語能力に焦点を絞って、現在のコンピュータ＝人工知能＝機械の言語能力がどのようなものであるかを、改めてチェックしてみることです。

【 AI との対話】

機械の言語能力の到達点を知る、一番簡単で確実な方法は、機械と「対話」することです。こうした機械の能力の評価のスタイルは、機械が人間並の言語能力をもって初めて可能になったことです。

何を「彼」または「彼女」に尋ねるかは、いろいろな選択肢があります。これは、これで面白いことだと思います。おおよそ、人間が考えることは、ことばで表現できます。「彼」または「彼女」が「考え」ていることは、そのことばで表現されるのでしょうか? （もっとも、こうした「擬人化」が適切かは、よく考えなければいけないことかもしれません。）

このセミナーを準備している間、毎日、GPT-4と会話したのですが、とても楽しかったです。時々、怪しいことを言う時もありますが、それは各種のセミナーの登壇者やネット上の記事(多分僕の投稿も)やWikipedia だっておんなじです。

彼(または彼女)は、ものしりであるだけでなく、とても「知的」です。チューリング・テストのような対話的なテストでは、彼(彼女)は「知能を持つ」と判定されるでしょう。

【生成AIの基本的能力】

セミナー冒頭の「連想と連想の鎖」のセクションでは、GPT-4が連想をどんどん広げていくことができることを紹介します。

これを「GPTは連想する力を持つ」と評価するのには異論もあるかもしれません。ただ、この「連想」の例は、GPTの新しい文を生成する能力の「す(素)のかたち」だと僕は考えています。これがGPTの基本的能力と考えた方がいいと思います。

セクション「語の意味」では、GPT-4が「語の意味」についてどのような情報を持っているのかを考えます。

「語の意味の分散モデル」では、語の意味は多次元のベクトルの一点として表現されるのですが、GPT-4が把握している実際の「語の意味」の実体は、そんなに単純ではないようです。

簡単なプロンプトを組んで、GPT-4からプリンストン大が公開している大規模な英語の辞書 WordNet のミニ版を簡単に再構成できることを示します。「大規模言語モデル」の「大規模」さがどういうものかがわかると思います。それはネットワーク上の最大規模の「辞書」を内容的には包含しています。

【「言語能力」をテーマにした対話】

今回のGPT-4との対話は、基本的にその言語能力をテーマにしたものです。

GPT-4自身にその能力を語らせるという、ちょっと意地悪なことをしています。「君の中では何が起きているの?」と聞いているのですが、すべての質問に納得のゆく答えが返ってくるとは限りません。

でもそれは、日本語をきちんと話す人が日本語文法を明文化されたルールの形で正確に知っているとは限らないのと同じです。

何が背景で起きているのかわからないことがいろいろあるのですが、なによりも、規模の巨大さは別にして比較的シンプルなメカニズム(「分散表現」+「Attention」)から、ああいう複雑な振る舞いが生み出されるのはやはり驚きです。

突っ込んで聞くと、時々、対話にストップが入るように思えることもあったのですが、それは、前回のセミナーで紹介した「Model Refusal」が発動されているからだと思います。すくなくともOpenAIは、GPT-4が自分の能力を過大に表現して人間に警戒心を与えることを強く警戒しているように思います。

それにもかかわらず、言語能力についての対話、認識論的関心からは、僕のHallucinationを含めて、いろいろ刺激的でした。自由に考えることは、多分、まだ我々の方が得意ですからね。

【人間の創造的な諸能力と言語能力】

人間の創造的な諸能力を機械で真似しようとしたら、言語能力を真似る機械を作ることから始めるのがいちばんの近道だと感じました。

こうした感想は、おそらく正しいものだと感じています。生成AIのその後の目覚ましい発展は、見かけは多様でもその中核には、人間の言語能力があることを確かめることができます。

なぜ、大規模言語モデルが、Multi Modal化して、画像を認識したり画像を生成したりできるのでしょうか？なぜ、大規模言語モデルが、RNAや物質の構造解析に利用できるのでしょうか？今度の9月のセミナーで、こうした問題を取り上げていきたいと思っています。

現在の到達点を特徴づけるとすれば、言語ネイティブな知能を持つ人間は、人間と同じ言語ネイティブな知能を持つ人工知能を作ることができたということだと、僕は考えています。人間の知能は数学ネイティブではありません。でも、数学ネイティブな知能は存在し得ます。( マルレク「人工知能と数学」を参照ください。 )　もっと言えば、量子ネイティブな知能があるのかもしれません。

【資料は少し長いです】

資料は少し長いです。ゆっくりお楽しみください。

-----------------------------
　セミナーのまとめページ
-----------------------------

今回のセミナーのまとめページはこちらです。

「GPT-4 との対話 -- プロンプトで遊ぶ」

https://www.marulabo.net/docs/prompt/

-----------------------------
　講演資料
-----------------------------

今回のセミナー資料は少し長いので、Part ごとに分割した資料も作成しました。

　● はじめに -- 対話を通じて分かったこと、問題意識と方法

https://drive.google.com/file/d/1PK8osE5PqyFQAaDwQeyXj3hmsOPgKC-W/view?usp=sharing

　● Part 1　文を生成する力 -- 連想と連想の鎖、意味のない文と曖昧な文

https://drive.google.com/file/d/1PZtVBeru90d2giryob6KNb7Zvyh_Lc-s/view?usp=sharing