巨人の肩に乗ろう！

12月 21, 2023

【 12/30 マルレク「大規模言語モデルの数学的構造 I 」申し込み受付開始】

大規模言語モデルの働きがよくわからないという人は少なくないと思います。僕自身もそうです。大規模言語モデルの振る舞いとその背後にある理由をもっとよく知りたいと考えている人は、きっと沢山いらっしゃると思います。

二回連続のシリーズを予定しているセミナー「大規模言語モデルの数学的構造」は、こうした疑問に、大規模言語モデルにカテゴリー論に基づくモデルを与えることで応えようとしたTai-Danae Bradley らの興味深い論文を紹介することを主要な目的にしています。

12月30日開催のセミナー「大規模言語モデルの数学的構造 I -- 言語へのカテゴリー論的アプローチ入門」はこの連続セミナーの第一回目です。お申し込みは、次のサイトからお願いします。https://llm-math.peatix.com/

連続セミナーの二回目は、「大規模言語モデルの数学的構造 II -- enriched categoryによる言語モデル」というタイトルで、来年の一月末開催予定です。ご期待ください。

12月30日のセミナーは、次のような構成を予定しています。

　⚫️ Part 1 構成的分散意味論の展開
　　・語の意味をどう捉えるか -- 分散意味論の系譜
　　・DisCoCatの登場
　　・Quantum NLP

　⚫️ Part 2 大規模言語モデルの特徴
　　・Tai-Danaeの問題提起
　　・Tai-Danaeの道具箱
　　・あらためて、セミナーの目的について

　⚫️ Part 3 言語をカテゴリーとして捉える

　　・preorderとしての言語

　・categoryとしての言語
　・functor：意味を表現する方法

　⚫️ Part 4 意味をカテゴリーとして捉える

　　・functor category と意味

　・Yoneda embeddingと意味の表現
　・言語のcategoryに確率を導入する -- enriched category

日頃あまり見慣れない用語や概念が出てくるので、最初はわかりにくいところが多いかもしれません。ただ、それは当然かもしれません。なぜなら、ここでの議論のベースになっているのは、50年以上前に数学の巨人であるグロタンディックやローベールたちが純粋数学の世界で作り上げた、functorial semantics, presheaf, topos という道具たちだからです。

しかし、大規模言語モデルの不思議さ以上に不思議なことが現在起きています。それは、かつての巨人たちが作り上げた抽象的な数学理論を、私たちが具体的な例を通じて容易に理解する道が開かれつつあるということです。その舞台が、カテゴリー論と比較してはるかに多くの人が関心を持っている大規模言語モデルだと、僕は考えています。

Yoneda lemma の名前ぐらいは知っていたのですが、その「実際的な応用」をIT技術者に語ることがあるなんて、まったく考えたことはありませんでした。今回のセミナーの準備を通じて、僕は、技術者には身近な大規模言語モデルを通じて、技術者が抽象的に見えるカテゴリー論の基礎を学習することが可能なのだと思い始めています。

現実の大きな変化に対応して、きっと何か大きな理論的なパラダイムシフトが進行しているのだと思います。きっと、皆が、当たり前のように、巨人の肩の上に乗ればいいのです。

大規模言語モデルや人工知能を語るにはカテゴリー論が必要で、逆に、カテゴリー論を語るには言語理論や人工知能論といった背景が必要なのだという認識が、きっと一般的なものになるだろうと考えています。

年の瀬も押し迫った時期でのセミナー開催ですが、このセミナーは、オンラインで開講します。ただ、コンテンツはリアルタイム配信ではなくYouTubeの限定配信で配信します。

受講を申し込まれた方には、セミナー当日セミナー開始時刻に、YouTubeの限定配信のURLと講演資料のpdfファイルをPeatixのメッセージを通じて配布します。

セミナーの内容は、YouTubeの限定配信ですので、セミナー当日に限らず、セミナー開始日時以降であれば、いつでも都合の良い時間に見ることができます。お正月休みにでも、ゆっくり視聴することも可能です。

セミナーにむけて、セミナーの解説資料、解説blogをMaruLaboのサイトから随時発信しています。事前にこのセミナーの内容をチェックしたい方は、こちらの「まとめページ」にアクセスください。https://www.marulabo.net/docs/llm-math/

また、セミナーに向けて準備した解説ショートムービーは、次の再生リストからアクセスできます。https://www.youtube.com/playlist?list=PLQIrJ0f9gMcPgnaymP8vC37oKdYa5pvDm

このブログを検索

過去・現在・未来

巨人の肩に乗ろう！

コメント

コメントを投稿

このブログの人気の投稿

1 + 196883 = 196884

機械の言語能力の獲得から考える embeddingの共有・蓄積・検索の未来

初めにことばありき