語の意味をどう捉えるか -- 分散意味論の系譜

【分散意味論の系譜】

このセッションでは、分散意味論の系譜を簡単に振り返ってみようと思います。

意味の分散表現論の起源の一つは、「ある語の意味は、ある言語におけるその使用である」というヴィトゲンシュタインの「意味＝使用」説だと言われています。

チューリングは、この説が気に入らなかったようで、「「機械」や「考える」という言葉の使い方をいくら調べた所で「機械は考える事ができるか」という問の意味も答えも明らかになるわけではない。それとも、「ギャラップの世論調査の様な　統計的研究」が必要という事になるのだろうか。」と痛烈な皮肉を言っています。

言語学では、イギリスの言語学者ファースが「状況の文脈」という概念で、意味の文脈依存的な性質に注目します。次のような言葉が有名です。

　“You shall know a word by the company it keeps”
「我々は、ある語を、それが引きつれている仲間たちによって知ることになる。」

Tai-Danae もこの言葉をよく引用します。

分散意味論は、フレームワークとして線形代数を使うようになります。基本的なアプローチは、分散情報を高次元ベクトルで表現し、意味の類似性をベクトルの類似性 cosine similarityで定義します。

こうした動きは、統計的言語モデルからニューラルネットワーク上での言語モデル構築へと進んでいきます。

Bengioの”A Neural Probabilistic Language Model”や、Deep Learningの世界では有名なMikalovのWord2Vecも、こうした流れの中で生まれたものです。

もう少し目を広げると、言語モデルには、文の意味は文中の単語の関係から導かれるというフレーゲの原理（構成性の原理）を中心とする数理論理学の考えに基づく、論理的なアプローチと、単語の意味はその文脈から決定することができるという確率論的アプローチの二つのタイプがあることがわかります。

問題は、「理論面では論理モデルが王者であったが、実践面では確率論的なライバルが最良の予測を提供してきた。」というところにありました。

そうした中で、「論理的形式」と「文脈的使用」という意味の定義特性の二者択一を超えるものとして、「意味の基礎構造とは何か」という問いを正面に掲げて、Coeckeら「構成的分散意味論＝DisCoCat」が、生まれることになります。

彼らが理論的武器にしたのは、カテゴリー論でした。

--------------------------------

ショートムービー「語の意味をどう捉えるか-- 分散意味論の系譜」を公開しました。
https://youtu.be/rluaHhcV5lM?list=PLQIrJ0f9gMcPgnaymP8vC37oKdYa5pvDm

「語の意味をどう捉えるか-- 分散意味論の系譜」のpdf資料
https://drive.google.com/file/d/1VbpCA6lnHx_e6z-xY6dhujkvQO6GiypU/view?usp=sharing

blog 「分散意味論の系譜」

https://maruyama097.blogspot.com/2023/11/blog-post_09.html

「大規模言語モデルの数学的構造」まとめページ
https://www.marulabo.net/docs/llm-math/

過去・現在・未来