copresheaf-意味論の射程
【 こんな理論が何の役に立つのか? 】
このセッションが、週末のセミナーに向けた最後のセッションになります。
簡単に、セミナー第二部のまとめをしたいと思います。
ここでは、このセミナーで紹介したような理論が、現実的・実践的にどのような役に立つのかという話をしようと思います。
それは、現在の大規模言語モデルの到達点をどうとらえるのかということと結びついています。僕は、大規模言語モデルは、さらに発展するだろうと考えています。では、どういうふうにそれは発展していくのでしょうか?
【 ここまでで見てきたこと】
ここまで見てきたこと、すなわち、SyntaxカテゴリーからSemantic カテゴリーの構成は、大規模言語モデルの次のような数学的モデルを構築できたということです。
「何の構造もないように見える具合的なテキスト・データから、その表現の継続の確率分布を大量に学習することによって、大規模言語モデルは内部に意味の世界を構築している。」
【 重要なのは、copresheaf-意味論 】
この数学的言語モデルには、重要なポイントがあります。
それは、言語の意味が住む世界を、[0,1]-copresheaf として、明確に定義したことです。
我々は、言語の文法構造については、いろいろ知ることができます。しかし、意味の世界がどのような構造をしているかについては、必ずしも明確な概念を持っているわけではありません。
しかし、大規模言語モデルが内部に構築する意味の世界を、 [0,1]-copresheaf としてとらえることは、意味へのアプローチを大きく変えるものです。
【 copresheaf-意味論の含意】
もし、意味が [0,1]-copresheaf で表現されるのなら、さまざまな意味の構成には、カテゴリー論的操作が対応しているということができます。
Part 2 で見た、論理的概念「red and blue」「red or blue」にカテゴリー論的な product と coproduct に対応づけたのは、その一例です。
もっともPart 2での議論は、productもcoproductも、未だenrich化されていませんでした。論理的概念「AND」と「OR」を[0,1]-copresheaf で表現するためには、 productもcoproductも、enrich化されなければなりません。
今回のセミナーでは論文を最後まで紹介できませんでした。
実は、論文はその後半部分で、「OR]という概念の構成を可能とするcoproduct のenrich化、「AND]という概念の構成を可能とするproduct enrich化を行っています。
この方向でのこの論文の重要な成果は、「implies」という論理的含意の概念が、𝐿 ̂のinternal-hom [ℎ^𝑥,ℎ^𝑦 ]であることを示したことです。
含意 𝑥 ⟹ y (xならばy)は、
copresheaf [ℎ^𝑥,ℎ^𝑦 ]:𝐿→[0,1]と定義できる。
【 copresheaf-意味論のvariant[0,∞]-𝑐𝑜𝑝𝑟𝑒𝑠ℎ𝑒𝑎𝑓 】
この論文は、単位区間[0,1]でenrich化するcopresheaf-意味論のvariantとして、[0,∞]区間でenrich化するcopresheaf-意味論も紹介されています。それは言語を一般的な計量空間と考えるものです。表現 redは、[0,∞]-𝑐𝑜𝑝𝑟𝑒𝑠ℎ𝑒𝑎𝑓 𝑑_𝑀 (𝑟𝑒𝑑,−) とみなされます。
redと継続しそうもない表現はredから離れた場所に、継続しそうな表現は、redの近くに置かれます。
【 copresheaf-意味論は「出発点」】
意味の世界の構造を探る糸口は掴めたのですが、我々は、大規模言語モデルが学習した意味の世界でさえも、実は、よく理解できているわけではありません。
ただ、意味の情報は [0,1]-copreshef カテゴリーに蓄えられていることを理解し、この情報に カテゴリー論的操作がどのように作用するかを理解することは、近未来のさまざまの具体的で魅力的な応用に道を開きます。
論文の” 6.1. Applications and future directions”には、興味深い方向が示されています。
copresheaf-意味論はAI研究の新しい「出発点」なのです。
--------------------------------
ショートムービー「 copresheaf-意味論の射程」を公開しました。
https://youtu.be/aiPHTX-u_KI?list=PLQIrJ0f9gMcPmrJ3B0LEXJ_SHPP-ak_hw
「 copresheaf-意味論の射程 」のpdf資料
https://drive.google.com/file/d/1EMveXx-VBnpESKEPF2t0URjlwyqQkCcV/view?usp=sharing
https://drive.google.com/file/d/1EMveXx-VBnpESKEPF2t0URjlwyqQkCcV/view?usp=sharing
blog 「 こんな理論が何の役に立つのか?」
https://maruyama097.blogspot.com/2024/01/copresheaf.html
「大規模言語モデルの数学的構造 II」まとめページ
https://www.marulabo.net/docs/llm-math2/
https://www.marulabo.net/docs/llm-math2/
ショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcPmrJ3B0LEXJ_SHPP-ak_hw
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcPmrJ3B0LEXJ_SHPP-ak_hw
コメント
コメントを投稿