Tai-Danaeの言語思想 -- ニューラル言語モデル批判

2月 23, 2024

【 2月は短いです -- 路線転換】

2月は短いので、あまり多くのセッションを開くことができません。予告では、今回のセッションは、Lawvere についてウンチクを垂れようと思っていたのですが、考えが変わりました。

あと、この論文に対して、僕は、あまり高い評価をしていませんでした。それも、考えを変えました。老人が、若い人のいうことに、いろいろ茶々を入れてもしょうがないと思います。

今回は、あまり細かな数学的な議論に入らないで、彼女が伝えたいと考えていることをストレートに分かりやすく伝えたいと思います。それは、今回のセミナーの意味を明確にすることにつながると思います。

【 Tai-Danaeの言語思想-- ニューラル言語モデル批判】

このセッションでは、この論文の後半に集中して記述されている彼女の言語思想を、先に紹介しようと思います。それは、言語思想の大きな流れの中で、現在のニューラル言語モデルの批判を、意図したものです。

彼女の数学モデルは難しいところがあるのですが、今回まとめた彼女の言語についての考え方は、言語学に興味のある人には、とても分かりやすいものだと思います。

以下、主要に、彼女の論文からの引用です。

【ニューラル言語モデルの成功】

「ニューラル技術が言語に対するより原理的なアプローチよりも優れている点があるとすれば、それは経験的な言語データに対して驚くほど高い性能を発揮できることである。

今後、どのような形式言語モデルがくるにせよ、現実世界におけるその品質と妥当性を判断することが、決定的な意味を持つことは間違いない。」

彼女は、ニューラル言語モデルが、その性能において大きな成功を収めていることを認めています。

【しかし、より広範で哲学的な疑問は残る】

「考えてみれば、文字列としてのコーパスはsyntacticsそのものであるから、言語のsyntacticalな特徴をテキスト・コーパスから抽出できることは驚くべきことではないかもしれない。しかし、より広範で哲学的な疑問は残る。もしそうだとしたら、意味の重要な側面が純粋な形式から生まれるということはあり得るのだろうか？最近のLLMの進歩に伴い、この問題はますます重要になってきている。」

【意味と形式は分離できない】

「意味と形式は切り離せないという考え方は新しいものではないが、現在のAIをめぐる哲学的な議論には浸透していない。」

AIの言語理論では、「意味と形式」は分離している。これが彼女の最初の批判です。

「厳密な哲学的見地から言えば、カントとヘーゲルの影響力のある著作は、形式と内容は排他的なものではないという原則に立っており、この考え方は、分析哲学の父であるフレーゲの思想の中核にも見出すことができる。」

大規模言語モデルに関連して、僕もいろいろ論文は読んでいるんですが、その中でカントやヘーゲルの名前をみたのは初めてです。

【ソシュールの構造主義言語学とチョムスキー】

「さらに重要なことに、形式と意味は独立していないという視点は、フェルディナン・ド・ソシュールの研究と、近代言語学の出現の動機となった構造主義革命によって、言語学の中心となった。重要な論点は、形式と意味、シニフィアンとシニフィエの両方が、共通の構造的特徴によって同時に決定されるということである。20世紀半ば、言語形式と意味は一枚の紙の裏表のように密接に関係しているというソシュールの考え方が言語学の分野で支配的であった。」

「1950年代後半にチョムスキーが革新的な生成言語学を導入したことで、構造主義的なプログラムは劇的に減速したのだが、チョムスキーのプログラムのもとでも、構造的な特徴が言語の性質を定義するものとしてとらえられ続けられた。」

【 20世紀末、言語に対する経験的アプローチの復活】

「20世紀末の言語学への経験的アプローチの復活は、この進化に新たな変化をもたらした。

コネクショニズム、コーパス言語学、潜在的意味解析、その他の言語学習可能性へのアプローチは、経験的データからあらゆる種類の構造的特性を引き出そうとする新たな努力を象徴しており、意味論と統語論を結びつける無数の概念的・技術的手段を提供している。」

興味深いのは、こうした動きに対する彼女の評価です。

「言語の形式にしかアクセスできない言語モデルにおいて意味論が問題となることは驚きかもしれないが、ここで重要なのは、形式から意味が生まれるという理論は、言語思想の広範かつ確立された伝統の一部であるということである。」

【ニューラル言語モデルの不十分さ】

「そして、このような伝統が、特にその構造主義的バージョンにおいて私たちに語っているのは、構文対象の分析において意味が問題になるとすれば、それはすべて言語の形式に反映された構造的特徴に起因するということである。」

しかし、現在のニューラル言語モデルが不十分なのは、まさにこの点である。というのも、ニューラル言語モデルは、そのタスクを実行する際に必然的に働く構造的特徴を明らかにしていないからである。」

--------------------------------

ショートムービー「 Tai-Danaeの言語思想-- ニューラル言語モデル批判」を公開しました。

https://youtu.be/xOv2_xKxmLw?list=PLQIrJ0f9gMcOJYKeUN_8q2K-yxtTfbIoB

「 Tai-Danaeの言語思想-- ニューラル言語モデル批判」のpdf資料
https://drive.google.com/file/d/1Hu4tNNqIAsncWmS8iW5235WBW-AmYiDG/view?usp=sharing

blog 「 2月は短いです -- 路線転換」

https://maruyama097.blogspot.com/2024/02/tai-danae.html

「言語の意味の数学的構造」まとめページ

https://www.marulabo.net/docs/embedding-dnn/

ショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcOJYKeUN_8q2K-yxtTfbIoB

このブログを検索

過去・現在・未来

Tai-Danaeの言語思想 -- ニューラル言語モデル批判

コメント

コメントを投稿

このブログの人気の投稿

初めにことばありき

密度行列とは何か？

「複雑性理論」は「複雑系」の議論とは別のものです