マルレク「ことばと意味の構成性について」講演ビデオ公開しました

  【 マルレク「ことばと意味の構成性について」講演ビデオ公開しました 】

昨年の12月24日に開催した、マルレク「ことばと意味の構成性について」の講演資料と講演ビデオを公開しました。あわせてこのセミナーのまとめページ  https://www.marulabo.net/docs/discocat/ も更新しました。ご利用ください。

このセミナーは、現在ビデオ公開中の「AIは意味をどのように扱っているのか?-- ChatGPTの不思議」https://www.marulabo.net/docs/meaning/  の内容を理論的に補うものです。

現在の「大規模言語モデル」の中核技術は、「ことばと意味」をコンピュータ上で扱う技術にあるのですが、その背景にどのような理論的問題があるかに興味ある方は、ぜひ、ご覧ください。

同時に、このセミナーは、サブタイトルの「 カテゴリー論と意味の形式的理論」が示すように、先日の投稿「カテゴリー論の時代始まる」で紹介した数理科学へのカテゴリー論の応用の紹介になっています。 

第一部では、カテゴリー論の創世記の重要な達成であるローヴェールのFunctorial Semanticsを紹介しています。

第三部は、言語学と意味の理論へのカテゴリー論的アプローチである、Discocat理論の紹介です。

4月のマルレクでは、この分野の最新の研究動向を紹介する「意味の分散表現技術の現在」というセミナーを開催しようと思っています。ご期待ください。

今回公開したセミナーのテーマの一つである、「構成性 compositionality」という概念は、カテゴリー論の基本的な特徴と考えられているのですが、あまり見慣れないものかもしれません。

ただ、この「構成的 compositional」という概念は、大規模言語モデルを考える上で、重要な意味を持っています。

昨年の10月に、Google と OpenAIは、ともに、「大規模言語モデル」ではモデルの規模拡大だけでは AIの能力は伸び悩むという論文を発表します。

OpenAIは、"Scaling Laws for Reward Model Overoptimization" という論文を発表します。それは彼らが同年の4月に発表していた "Training language models to follow instructions with human feedback"の立場を再確認して、この伸び悩みをAIシステムに「人間からのフィードバック」を取り入れることで乗り越えようとしました。それがChatGPTです。

Kristina Toutanova 率いる Google Labo は、この時、次のようなタイトルの論文を発表します。" Evaluating the Impact of Model Scale for Compositional Generalization in Semantic Parsing" 。( Kristina は、BERT論文の Last Author で、「大規模言語モデル」の文字通りの「産みの母」です。)

「人間からのフィードバック」か「構成的一般化」か、言語モデルが進むべき道を巡って、二つの道の対立があるのです。「ことばと意味の構成性」を重視するのかどうかで、立場が分かれると思います。

最近の流れでは、実践的には、OpenAIの圧勝のように見えるのですが、理論的には、決着がついたわけではありません。僕は、Googleが提起した問題意識の方が好きです。

もっとも、大規模言語モデルは、BERTにしても、RNNが獲得した「文法性」「構成性」を認識する不思議な能力に、その理論的な根拠を意識することなく「ただ乗り」していたわけで、そのつけが回ってきているのだと思います。

そのあたりの問題と解決の理論的枠組みについて、4月のセミナーでは考えていきたいと思っています。

-----------------------------

「ことばと意味の構成性について」のセミナーの講演ビデオ全体の再生リストのURLです。https://www.youtube.com/playlist?list=PLQIrJ0f9gMcMRifv2EMXTqsrAjLZGi5vb

この再生リストは、次の三つのビデオを含んでいます。個別に再生できます。

 ●  第一部 意味の理論入門
https://youtu.be/okExwVTNMAw?list=PLQIrJ0f9gMcMRifv2EMXTqsrAjLZGi5vb

 ●  第二部 ことばの構成性 ー 文法 ー
https://youtu.be/ZgA8nrr4lOY?list=PLQIrJ0f9gMcMRifv2EMXTqsrAjLZGi5vb

 ●  第三部 意味の構成性 ー カテゴリー論的分散意味論 ー
https://youtu.be/3EF4bMqwYco?list=PLQIrJ0f9gMcMRifv2EMXTqsrAjLZGi5vb

-----------------------------

講演資料(スライドのpdf版)は、次からアクセスできます。https://drive.google.com/file/d/1U1_Eo1EWALVMAdkZB2OyhWRpE4ANitnF/view?usp=sharing

それぞれのパートごとに分けた講演資料です。

 ●  第一部 「意味の理論入門」https://drive.google.com/file/d/1U12AU1wgl_5BtpTKvrgoSwYY7aJVsSWv/view?usp=sharing

 ●  第二部 「ことばの構成性 -- 文法 」
https://drive.google.com/file/d/1U-7dqAE-VLs3MJ25mwKVDl21tu8GNQ7K/view?usp=sharing

 ●  第三部「意味の構成性 -- カテゴリー論的分散意味論 」https://drive.google.com/file/d/1TyN0iACkwt0uMptzTnoxuDARA5P9OAn3/view?usp=sharing

-----------------------------

「ことばと意味の構成性について」セミナーのまとめページはこちらです。https://www.marulabo.net/docs/discocat/

このセミナーに向けたショートムービーの再生リストです。こちらもご利用ください。https://www.youtube.com/playlist?list=PLQIrJ0f9gMcN2nXtvKCK4ApBaVglV8Drx

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について