preorderとしての言語

【 言語のプリミティブな構造を考える 】

これから Tai-Danae の大規模言語モデルの数学的モデルの紹介をしたいと思います。細かいテクニカルな話に入ってしまうと、全体の流れが見えにくくなるので、彼女のアプローチの基本的な骨組みの概説を先行して、段階的に進めたいと思います。

概説の第一回目である今回は、言語のプリミティブな構造としてpreorderという構造に注目するという話をします。

【 pregroupからpreorderへ 】

DisCoCatの言語理論の前提の一つは、自然言語が構成的な文法構造を持つことです。それは、通常は、Lambekのpregroup文法で記述されています。

DisCoCatとLambekのpregroup文法については、2022年12月のマルレク「ことばと意味の「構成性」について」https://www.marulabo.net/docs/discocat と、その中の次の資料を参照ください。 https://www.marulabo.net/docs/discocat/#Pregroup_Grammar 

pregroupは、基本的には、いくつかの代数的構造を持つ「半順序集合(partial order set: poset)」です。カテゴリー論的には、monoidal categoryの一種で、compact closed categoryになります。それは「半順序」より、複雑な構造を持っています。

大規模言語モデルが、「構造化されていないテキストデータの相関関係から完全に構築されている」とみなそうとする Tai-Danaeにとって、pregroupという構造を前提にすることはできません。

彼女が選んだのは、pregroupがもつ余分な代数的な構造(monoidとself dual)を捨て、さらに残った半順序(partial order)からも、ある性質を捨てて得られる 非常にプリミティブな前順序(preorder)という構造から大規模言語モデルの振る舞いを数学的に再構築するという道でした。

その意味では、彼女は、テキストデータが、「全く構造化されていない」と考えたわけではありません。最低限の前提ですが、言語は、 preorder という構造を持つのです。


【 preorderとは何か 】

順序≤が定義された集合𝑃で、𝑃に属する任意の要素 𝑎, 𝑏, 𝑐 が次の性質を持つとき、順序≤ はpreorder(前順序) と言われます。

 1.  ∀𝑎 ∈ 𝑃.  𝑎 ≤ 𝑎   (反射律)
 2.  ∀𝑎,𝑏,𝑐 ∈ 𝑃. 𝑎 ≤ 𝑏 で 𝑏 ≤ 𝑐 なら 𝑎 ≤ 𝑐   (推移律)

このpreorderの条件は、この二つの条件に加えて次の条件を満たすpartial order (半順序)より弱いものです。

 3.  ∀𝑎,𝑏 ∈ 𝑃. 𝑎 ≤ 𝑏 かつ 𝑏 ≤ 𝑎 なら 𝑎 = 𝑏 

ちなみに、以上の条件に加えて ∀𝑎,𝑏 ∈ 𝑃. 𝑎 ≤ 𝑏 または 𝑏 ≤ 𝑎 なる条件を満たす順序を total order (全順序)と言います。


【 語の並びとしての言語と preorder 】

先に、言語は preorder という構造を持つとしたのですが、この仮定が不自然なものではないことを見ることにしましょう。

ここでは、言語は語の並びだと考えることにします。実は、これも、正確に言うと言語の構造についての仮定なのですが、大規模言語モデルの入力に与えられるテキストデータは、どの言語のテキストであれ、語の並びと考えることはできそうです。

このとき、語の並びからなる二つの表現SとTがあるとき、SとTとの間の順序≤ を次のように定義します。

 ⚫️  SがTの部分文字列である時、S ≤ T
 ⚫️  そうでない時、SとTの間には、順序関係は存在しない。

具体的な例で見てみましょう。

 red  ≤ red firetruck
 red  ≤ red blooded
 red  ≤ red ruby  ≤  beautiful red ruby
 red  ≤ red ruby  ≤  bright red ruby
 red  ≤ red meat  ≤  eat red meat  ≤ I eat red meat
 dog  ≤ hot dog  ≤ hot dog with mustard
 dog  ≤ hot dog with mustard
 beautiful  ≤  beautiful day  ≤ ice tea on a beautiful day
 tea  ≤ ice tea
 …

表現SとTが、S ≤ T という順序関係がある時、S→Tと、SからTに向かう矢印で表すことにします。

【 次回予告 】

概説の二回目である次回は、言語をカテゴリーとして捉えて、決してプリミティブなものではない言語の意味の構造にアプローチする準備をします。そこでは、Firthの意味論と米田の補題の話をします。

--------------------------------

ショートムービー「 preorderとしての言語 」を公開しました。
https://youtu.be/GNsejzn_ylM?list=PLQIrJ0f9gMcPgnaymP8vC37oKdYa5pvDm

「 preorderとしての言語 」のpdf資料
https://drive.google.com/file/d/1nDqQ-gbTiqFnH6ELgh7csYpFzDglCwHI/view?usp=sharing

blog 「 言語のプリミティブな構造を考える 」
https://maruyama097.blogspot.com/2023/12/preorder.html

「大規模言語モデルの数学的構造」まとめページ
https://www.marulabo.net/docs/llm-math/


コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について