カテゴリー論的構成的分散意味論 -- DisCoCat

 【 本当は、深い問題 】

このセッションでは、Bob Coecke らの「 カテゴリー論的構成的分散意味論 」を取り上げます。 

この通称DisCoCat理論は、直接には、「文の意味は、個々の語の意味と、語から文を構成する文法規則によって構成的に決定される」という構成性の原理を文の意味論においても適用することを目標にしています。

「我々は、ベクトル空間モデルによる分散意味論と、Lambekによって導入されたPregroup代数に依拠した文法的型の構成的理論を統合する数学的枠組みを提案する。」

「この数学的枠組みにより、適切に型付けされた文の意味を、その構成要素の語の意味から計算することができる。」

この理論は、現在の大規模言語モデルベースの人工知能ブームの元では、「人工知能」の「意味の理論」の一変種と受け止められるかもしれません。ただ、そうではありません。彼らの理論の登場は、実は、もっと深い意味を持っていると僕は考えています。

そのことを彼は明確に意識しているように思います。

「意味の記号論と分散意味論は、ある意味直交する競合する理論である。それぞれに長所と短所がある、前者は構成的だが定性的で、後者は非構成的だが定量的である。認知科学の文脈でも、こころのコネクショニスト的モデルと記号論的モデルの間に類似の問題が存在する。」

人工知能論だけではなく、認知科学全体で、コネクショニズム的アプローチと計算主義的アプローチは、「直交する競合する」理論的立場です。

僕は、基本的には、計算主義の立場で数学論を考えているのですが、それで満足している訳ではありません。ただ、それ以上に、現在の大量のデータとDeep Learning の手法がもたらす認識のリーチには、懐疑的です。

彼らの論文は、直接には、言語の意味表現について語っているのですが、彼らがしめしたことは、前述の二つの「直交する競合する」理論の「統合」が可能だということです。しかも、それが、我々にとっては極めて身近な存在である「ことばとその意味」の世界に、二つの理論の統合の可能性が見つけられるという展開は、とても刺激的です。

物理学では、「決定論」と「確率論」の関係については、さまざまな議論がありました。通常は、量子の状態は、ボルンのルールに従って確率振幅があたえられます。ただ、観測がなければ、量子の系の状態は、ユニタリー変換に従って「決定論」的に推移します。

物理の世界の理論構成から学ぶべきことは多いと感じています。

Bob CoeckeのDisCoCatで興味深いのは、彼が「意味の世界」の中に、量子の世界の「エンタングルメント」に対応する「分離不能」な状態を、至る所で見出していることです。

僕たちは、もっと深い認識の戸口に立っていると感じています。まだ、入り口が見つからず、彷徨っているのですが。

-------------------------------------

「 カテゴリー論的構成的分散意味論  -- DisCoCat 」を公開しました。
https://youtu.be/FQb9o2gHrJ0?list=PLQIrJ0f9gMcMpryyqVYL-T8Z4zQ-ejvpF

資料pdf
https://drive.google.com/file/d/12WAu3gPHsImisbv2w8UPiJOtCWOfbsPi/view?usp=sharing

blog:「本当は、深い問題 」
https://maruyama097.blogspot.com/2023/04/discocat-1.html

「ことばと意味の数学的構造」まとめページ
https://www.marulabo.net/docs/math-structure/

「ことばと意味の数学的構造」セミナー申し込みページ


コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について