Tai-Danaeの reduced densityとenriched category

 【 探究は続く 】

今回のセミナーでは、Tai-Danae Bradleyの次の論文の紹介する予定でした。

Language Modeling with Reduced Densities
https://arxiv.org/abs/2007.03834v4  

ただ、今回は他の部分が膨らんで、また、準備に十分な時間が取れず断念しました。すみません。

この Tai-Danaeの論文の数学的基礎の reduced density については、2023年2月のマルレク 「密度行列 ρ で理解する確率の世界」がその解説になっています。先日、講演資料と講演ビデオを公開したので、そちらを参照ください。
https://www.marulabo.net/docs/density2/ 

セミナーの構成を変更して、「意味の分散表現論の系譜 – 大規模言語モデルへ 」の部分を切り離したので、そちらに含まれていたTai-Danae の新しいアプローチを紹介していた部分を、改めて今回のセミナーの一部として再掲したいと思います。

なぜ、DisCoCatの流れの中で、Tai-Danae の議論に注目するのでしょうか? この論文の冒頭で、彼女はこう言っています。

「この研究は、今日の最先端の統計的言語モデルが、その性能において印象的であるだけでなく、より本質的に重要なことは、それが構造化されていないテキストデータの相関関係から完全に構築されているという観察から生まれたものです。」

彼女の関心は、現在の「大規模言語モデル」の「印象的」な成功に向けられています。彼女はそれがDisCoCatモデルとは少し異なる言語モデルであることも知っています。その上で、その背後にあるものを探り出そうとしているのです。

僕にとって印象的だったのは、彼女が次々と問題を立てることでした。答えの前には、もちろん、問題があります。ただ、答えを見つける条件が成熟するというのは、正しく問題をたてることができるということです。

 ⚫️ 自然言語における表現の意味をとらえる数学的構造は何か?
 ⚫️ この構造は、テキスト・コーパスを用いてどの程度まで十分に検出できるのか?
 ⚫️ 抽象的な概念とその相互関係を自然に掘りだす方法はあるのか?
 ⚫️ 論理と命題の連関はどのようにして生まれるのか?

こうして、彼女は、次の二つが基本的な問題だとします。

 ⚫️ どのような数学的構造が、構造化されていないテキストデータには存在するのか?
 ⚫️ どのようにして、テキストの情報は、カテゴリー構造を維持したまま保存され、モデル化することができるのか。

先の論文は、この問題に対する彼女の答えを述べたものです。

彼女の答えは数学的に表現されたものなのですが、すくなくとも彼女の「問題意識」は、わかりやすいものだと思います。

数学的には、文法を記述するpregroup ではなくpreorder まで条件を緩めれば、少なくとも、「黒い犬」は「犬」であるという、語とフレーズのentailment (含意)を、構造化されていないデータから導出できるだろうと彼女は言います。

逆にいうと、現代の大規模言語モデルは、直接に教え込まないと、こうした判断がうまくできないのです。2022年のGoogleの論文で、Kristina Toutanova たちが述べていた「多くのタスクで強力な性能を発揮するにもかかわらず、事前学習された言語モデルは、分布外の構成的一般化で苦労することが示されている。」というのは、こうしたことを指しています。

彼女の理論は、こうした実際的な問題を解決する道につながるかもしれません。

彼女が、利用している enriched category というのは、monoidal categoryの拡張と考えることができるのですが、今回は触れることができませんでした。

-------------------------------------

「 Tai-Danaeの reduced densityとenriched category 」を公開しました。
https://youtu.be/Zb_nkoY-AkQ?list=PLQIrJ0f9gMcMpryyqVYL-T8Z4zQ-ejvpF

資料pdf
https://drive.google.com/file/d/1O0w3KN6cGS_JEPrjPTZXmot73pX7kDV9/view?usp=sharing

blog:「探究は続く 」
https://maruyama097.blogspot.com/2023/04/tai-danae-reduced-densityenriched.html

「ことばと意味の数学的構造」まとめページ
https://www.marulabo.net/docs/math-structure/

「ことばと意味の数学的構造」セミナー申し込みページ

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について