Reel Header
【 トークンとテキスト (動画)】
このセッションでは、Bradleyの2025年の論文を読むにあたって必要な準備を行います。
Bradleyは新しい論文で、現実のLLMの具体的な振る舞いに合わせて新しいLLMのモデルを提案しています。今回は、まず、そこで導入されたノテーションや定義を紹介します。
【 新しいLLMモデルは、何を目的としているのか 】
論文の「はじめに」の部分で、彼女はこう述べています。
「以前の論文ではπ(y|x)の明示的な定義は与えられていなかったが、本稿ではこれらの値がLLMによって生成される次トークン確率から実際に生じ得ることを示す。
類似の構成は[GV24]にも見られるが、我々の手法は有限コンテキストサイズに加え、文頭トークン(⊥で表記)と文末トークン(†で表記)も考慮に入れる。
これにより、π(−|x) は入力 x に対する LLM の終端状態集合 T(x)、あるいは同値的に可能な出力集合上の確率質量関数と見なせることが証明できる。」
【 新しいLLMモデルの構成の詳細はスライドで 】
新しいLLMモデルの構成の詳細については、ビデオあるいはスライドpdfを参照ください。
【 L_x の構成に注目 】
一つだけ補足すると、この中で部分カテゴリー L_x の構成には注目ください。𝐿_𝑥 のオブジェクトは x → y を満たす y ∈ L です。
-----------------------------
まとめページ「LLMのマグニチュード論」
https://www.marulabo.net/docs/llm1bradley2/
ムービーの再生リスト「LLMのマグニチュード論 -- エピソード」
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcMjv25F7mabNGdzKUVt-2CZ
本日のムービーのpdf 「トークンとテキスト」
https://drive.google.com/file/d/11oAZla0Z0krd4ajXrAK75A5Au84eD34_/view?usp=sharing
https://drive.google.com/file/d/11oAZla0Z0krd4ajXrAK75A5Au84eD34_/view?usp=sharing
コメント
コメントを投稿