マルレク「LLMのマグニチュード論 1」へのお誘い
【 マルレク「LLMのマグニチュード論 1」へのお誘い 】
今週末(12月6日(土))に開催予定のマルレク「LLMのマグニチュード論 1」へのお誘いです。
セミナーへのお申し込みは、次のページからお願いします。
今回のセミナーでは、LLMの理論研究で、もっとも新しく最も先進的な業績である Tai−Danae Bradleyの論文 “The Magnitude of Categories of Texts Enriched by Language Models” https://arxiv.org/pdf/2501.06662 の紹介をしようと思います。
【 この論文が扱っている二つの課題 】
この論文は、二つの課題を扱っています。
一つは、LMの意味論に カテゴリー論的基礎を与えた 2022年のBradleyらの論文“An enriched category theory of language: From syntax to semantics.” のモデルを拡大するという課題です。
たとえば、「プロンプトの入力」「プロンプトへの回答の出力」というような、LLMの現実の振る舞いを解釈しうるようにLLMのモデルを拡大するということです。
もう一つの課題は、こうして現実のLLMの振る舞いをシミュレートしうる拡大されたLLMのカテゴリー論的理論をを構築し、それを、この間マルレクでも取り上げてきたマグニチュードの理論を結びつける課題です。
【 今回のセミナーが扱う範囲とセミナーの構成 】
ただし、今回のセミナー「LLMのマグニチュード論 1」は、そうしたBradleyの論文紹介を目的とした連続セミナーの第一回目です。
今回のセミナーがカバーする内容は、先の「この論文が扱っている二つの課題」の前半部分の「LLMのモデルの拡大」にフォーカスしたものです。
今回のセミナーの構成は、次のようになります。
Part 1 BradleyのLLMモデル論概要
Part 2 LLMの確率計算
Part 3 Enrichedカテゴリー論とLLMモデルの拡大
【 Part 1 BradleyのLLMモデル論概要 】
連続セミナーの第一回目として、 Bradley論文の全体の構成について、この Part 1 で触れています。
【 Part 2 LLMの確率計算 】
Part 2 は、論文の前半部分のLLMモデルの拡大に関連して、LLMの確率計算の基本について次のような項目で解説します。
・トークンとテキスト
・LLMとテキスト上の誘導確率
・LLMの確率計算の基本
・論文前半の基本定理の証明
【 ネクスト・トークン予測確率とLLMの振る舞いについて 】
確率的大規模言語モデル(例:GPT、Llama)が次トークン予測で訓練された際の挙動を以下のように特徴付けることができます。
・任意のユーザー入力 𝑎 ∈ 𝐴^∗に対し、モデルはトークン化されたプロンプト 𝑥 = ⊥𝑎 を入力として受け取り、確率分布 𝑝_𝑥 ≔ 𝑝( −│𝑥) : A ∪ {†} →[0, 1] を生成します。
𝑝_(⊥𝑎) (−│⊥𝑎)
・確率分布 𝑝_𝑥を生成した後、モデルは𝑝_𝑥に従ってトークン𝑎_1をサンプリングします。 𝑝_(⊥𝑎) (𝑎_1│⊥𝑎)
・𝑎_1=†の場合、処理は終了しモデルはaを出力します。そうでない場合、トークン𝑎_1はaに追加されます。
・これらの手順は繰り返されることになります。
【 関数 𝜋(y|𝑥) が確率を与えること 】
重要なことは、先に見たネクスト・トークン確率の積として定義される関数 𝜋(y|𝑥) が、「LLMにプロンプトx を与えた時、LLMが出力y を返す確率」として解釈できるということです。セミナーでは、そのことをきちんと証明したいと思います。
【 Part 3 Enrichedカテゴリー論とLLMモデルの拡大 】
Part 3 では、論文前半のもう一つの重要な内容である、enrichedカテゴリー論を用いた、LLMへの確率の理論的導入について解説します。
終端状態集合 𝑇(𝑥)上で定義された関数 𝜋(y|𝑥) を用いて、カテゴリーLをenrich化されたカテゴリーに拡張します。
具体的には、LLMによって生成される確率𝜋から、次の二つのenrichedカテゴリーの導出を行います。
・[0, 1]-カテゴリー ℒ
・[0, ∞]-カテゴリー ℳ
前者は、LLM に確率モデルを与え、後者は、LLM に距離モデルを与えます。
後者の距離モデルは、論文後半の LLMのマグニチュード論の基礎を与えることになります。
---------------------------
セミナーへの申し込みページ
https://llmbradley2.peatix.com/view
https://llmbradley2.peatix.com/view
セッションの要約blog
https://maruyama097.blogspot.com/2025/11/llm-1.html
まとめページ「LLMのマグニチュード論 1」
https://www.marulabo.net/docs/llm1bradley2/
ムービーの再生リスト「LLMのマグニチュード論 -- エピソード」
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcMjv25F7mabNGdzKUVt-2CZ
本日のムービーのpdf 「 マルレク「LLMのマグニチュード論 1」へのお誘い 」
https://drive.google.com/file/d/1vKmIbxNCH2ZZU3SWIwqC_ipwoR_TW4GY/view?usp=sharing
https://drive.google.com/file/d/1vKmIbxNCH2ZZU3SWIwqC_ipwoR_TW4GY/view?usp=sharing
本日のムービー「 マルレク「LLMのマグニチュード論 1」へのお誘い 」
https://youtu.be/rwXB6TCJ2Vo?list=PLQIrJ0f9gMcMjv25F7mabNGdzKUVt-2CZ
コメント
コメントを投稿