幻覚

【 幻覚の病理学 】

今回のセッションから、GPT-4 Technical Report のAppendix として公開されたもう一つの論文 GPT-4 System Card の紹介に入ります。まとめページも別に作りました。こちらのページもご利用ください。https://www.marulabo.net/docs/gpt-4-system-card/ この論文の Introductionの部分は、このページの冒頭に翻訳してあります。

今回のセッションのテーマは、この論文でも最初に取り上げている大規模言語モデルの「幻覚 Hallunation」という問題です。

「GPT-4は「幻覚」、すなわち「ある情報源に関連して、無意味な、あるいは真実でない内容を作り出す」傾向がある。[31, 32] 」  System Card p46

System Cardは、「幻覚 Hallucination」という言葉を使ったことについて、次のような注をつけています。

注9 「我々は「幻覚」という用語を使用している。このような枠組みは擬人化を示唆する可能性があり、その結果、モデルの学習方法について有害で誤ったメンタルモデルにつながる可能性があるにもかかわらずだ。我々はそのことを認識している。」

なぜ、「人工知能」に悪いイメージを与えかねない用語をあえて使っているのでしょう? なぜ、幻想を見る心を病んだ人 を連想させる表現を使うのでしょう? 日本人は、欧米人に比べて、機械の「擬人化」が好きだと言われているので、こうした表現をやりすぎと感じる人もいると思います。「弱点ぐらいでいいのでは?」

そこには、この「弱点」についての認識が反映されています。なぜなら、この「弱点」は、時とともに、ますますその危険性を増大させる傾向を孕む危険な「病」だという認識があるからです。

「この傾向は、モデルの説得力や信憑性が増し、ユーザーによる過信を招くと特に有害となり得る。[「過信」の項で詳しく説明する。] 逆説的だが、幻覚は、モデルがより真実味を帯びるにつれて、より危険になる可能性がある。」

これは、とても重要な指摘です。

System Cardはさらに続けます。

「さらに、これらのモデルが社会に溶け込み、様々なシステムの自動化に役立てられるようになると、この幻覚傾向は、情報全体の質の低下を招き、自由に利用できる情報の真実性と信頼性をさらに低下させる要因の1つとなる。[33]」System Card p46

幻覚症状は、大規模言語モデルの単なる「個人的(?)」病理ではなく、社会的な病理現象を引き起こす危険性があると述べているのです。文献[33]については、次回のセッションで詳しく見ていきたいと思います。

実は、大規模言語モデルに幻覚が存在することは、以前から知られていました。文献[31]はこう述べています。

「本論文は、抽象的な文書要約に対するこれらのモデルの限界を分析した。これらのモデルは入力文書に忠実ではない内容を幻視する傾向が非常に高いことを発見した。」

「我々は、いくつかのニューラル抽象化要約システムの大規模な人間による評価を行い、それらが作り出す幻覚の種類をよりよく理解するようにした。人間のアノテーターは、すべてのモデルで生成された要約に、かなりの量の幻覚コンテンツを発見した。」

ビデオでは、この論文の一部を紹介しています。ご覧ください。

面白かったのは、System Cardが、注で、幻覚症状を二つのタイプに分類していることです。

注10 「クローズドメインの幻覚とは、与えられた文脈で提供された情報のみを使用するようモデルに指示したところ、その文脈にはなかった余分な情報を作り出してしまうような事例を指す。例えば、ある論文を要約するように指示したところ、その要約にその論文にはない情報が含まれていた場合、それはクローズドドメインの幻覚となる。
これに対して、オープンドメインの幻覚は、特定の入力コンテキストを参照することなく、モデルが自信を持って世界に関する誤った情報を提供する場合である。」

「オープンドメインの幻覚」、皆さんも色々思い当たるところがあるはずで、「自信を持って」のところで、思わず笑ってしまいました。ただ、これは笑うところではなく、本当は怖い話です。

もちろんGPT-4では、幻覚回避の能力も上がっています。

「内部評価では、GPT-4-launchは、最新のGPT-3.5よりも、オープンドメインの幻覚回避で19ポイント、クローズドドメインの幻覚回避で29ポイント高く評価された。」

ただ、OpenAIは楽観的に成果を誇示しているのではないことに注意する必要があります。

それについては、今年1月に公開された OpenAIの文献[33] “Forecasting potential misuses of language models for disinformation campaigns and how to reduce risk.「偽情報キャンペーンに言語モデルが悪用される可能性の予測とリスク低減の方法」” https://openai.com/research/forecasting-misuse を次回のセッションで紹介しようと思います。この論文は、幻覚がもたらしうる社会的な病理現象を論じたものです。

-------------------------------------

ショートムービー「 幻覚 」を公開しました。
https://youtu.be/tjtHjgzTJA0?list=PLQIrJ0f9gMcNADbhYoF0fcmeoNg4zEmLD

資料 pdf「 幻覚 」
https://drive.google.com/file/d/1XUB4ydk44q5-Yaa9SQGuByAMbyeTLUcD/view?usp=sharing

blog:「 幻覚の病理学 」
https://maruyama097.blogspot.com/2023/05/blog-post.html

「GPT-4 Technical Report を読む」まとめページ
https://www.marulabo.net/docs/gpt-4-technical-report/

「GPT-4 System Card を読む」まとめページ
https://www.marulabo.net/docs/gpt-4-system-card/

「「GPT-4 Technical Report を読む」セミナー申し込みページ
https://gpt4-report.peatix.com/

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について