GPT-4は、まだ、日本語が苦手かもしれない
【 GPT-4は、まだ、日本語が苦手かもしれない 】
今回のセッションは、「意味のない文と曖昧な文」をGPT-4がどう扱っているかがテーマです。
もともとは、GPT-4の「連想する力」に興味があって、その力の背景をプロンプトを通じて探ろうと思っているのですが、今回はたまたま連想の始点に、"colorless green ideas sleep furiously" という「意味のない文」をおきました。
面白かったのは、最初のregenerate でGPT-4は目ざとく、次のことに気づきます。
「"colorless green ideas sleep furiously"は、言語学者のノーム・チョムスキーが統語論を説明するために作った有名な文です。文法的には正しいですが、意味的には一見矛盾しているように見えます。それを踏まえて、次のように連想の鎖を作ります:」
ただ、生成された連想の鎖をチェックしたのですが、「それを踏まえて」いるわけじゃないことに気付きます。意味のない「有名な」文から連想を始めたのですが、連想されたのはみな意味のある文でした。それも当然かもしれません。連想は、意味があって初めて機能するものですから。
というわけで、今度は、連想ではなく GPT-4に「文法的には正しいが意味のない文」を直接に生成させてみました。結果は少し、微妙なものでした。GPT-4には、「意味的に矛盾していること」を「実際には存在しないこと」と同義に捉える傾向があるようです。
"colorless green"や"sleep furiously"はことばの上の意味的矛盾ですが、生成された"Silent thunder" や "Transparent stones" の無意味さはことばの世界に閉じた問題ではなく、現実の認識が関わっています。確かに、"green idea" はどちらなのかと考えれば、両者の区別には微妙なところがあります。
「意味がない」ことをきちんと考える必要があるようです。大規模言語モデルに意味のない文を作れというのは、愚問だったかもしれません。でも、またプロンプトで挑戦しますね。
ショートムービー「 意味のない文と曖昧な文 」を公開しました。
https://youtu.be/GmtIs5Zso44?list=PLQIrJ0f9gMcMZkwx9VXm46JJ57pNpix1b
資料 pdf「意味のない文と曖昧な文 」https://drive.google.com/file/d/1c81P41dAeRLckoDKAb9rA_vvm5HCb_8b/view?usp=sharing
コメント
コメントを投稿