現実の経験的データからの構造の抽出の試み

【 Tai-Danaiのニューラル言語学批判 】

前回のセッションでは、少し説明の順序を変えました。それはこの論文を通じて彼女が何を主張したかったのかを、あらかじめ明確にしておくほうが、論文の展開を追いやすいと考えたからです。

彼女は、この論文を通じて、現代の主流である「ニューラル言語学」に対して、言語理論と言語へのアプローチの数学的方法の両面で批判を試みています。

今回のセミナーの大事なポイントですので、改めて、彼女の主張を見ておきましょう。

【 言語の形式と意味をめぐって 】

彼女の主張は、次のように始まります。

「意味と形式は切り離せないという考え方は新しいものではないが、現在のAIをめぐる哲学的な議論には浸透していない。」

「厳密な哲学的見地から言えば、カントとヘーゲルの影響力のある著作は、形式と内容は排他的なものではないという原則に立っており、この考え方は、分析哲学の父であるフレーゲの思想の中核にも見出すことができる。」

「さらに重要なことに、形式と意味は独立していないという視点は、フェルディナン・ド・ソシュールの研究と、近代言語学の出現の動機となった構造主義革命によって、言語学の中心となった。」

彼女は、近代言語学の始まりとなった、ソシュールらの「構造主義言語学」の再評価を求めています。

なぜ、構造主義なのか? 彼女の次の指摘は、重要だと思います。

「そして、このような伝統が、特にその構造主義的バージョンにおいて私たちに語っているのは、構文対象の分析において意味が問題になるとすれば、それはすべて言語の形式に反映された構造的特徴に起因するということである。」

意味が問題になるとすれば、それはすべて言語の形式に反映された構造的特徴に起因するということであるという視点が、言語へのアプローチでは重要だといいます。

「しかし、現在のニューラル言語モデルが不十分なのは、まさにこの点である。
というのも、ニューラル言語モデルは、そのタスクを実行する際に必然的に働く構造的特徴を明らかにしていないからである。」

【 今回のセッションで彼女が明らかにしたこと 】

こうした視点から、今回のセッションで彼女が数学的な手法を通じて、あきらかにしようとしたことを見ていきましょう。

それは単純に見える文字列の並びにも、構造が隠れていることを、その構造を抽出する方法とともに示してみせたことだと思います。

その方法は、このセミナーの前半で紹介した、線形代数の行列の分解を用いる方法と、Formal Concept Analysisの方法の二つです。詳しくはここでは繰り返しません。(スライドのタイトルが緑のページ、あるいは、灰色の背景色のページは、以前のスライドと同じ内容であることを表しています。)

彼女は、一見すると何の構造もないように見える文字の並びに、実際の言語使用のデータを解析すれば、「子音」「母音」「数字」等の明確なクラスターが構造として隠れていることを見出します。

【 そんなことに意味があるのか? 】

「アルファベットや数字の並びに、そんなに意味があるの?」

確かに、それ自体は、意味とは関係ないですね。

ただ、今回は、文字の並びの構造の解析でしたが、次回紹介するのは「語」の並びの解析です。そこには、おもしろい発見があります。

彼女の最初の問題意識を思い出してください。それは、何の構造もないように見える生の言語データから、大規模言語モデルが意味の世界を見つけていくことへの不思議さへの驚きでした。

彼女は今、「何の構造もない」ように見える言語データの中に、豊かな構造があることを見つけ出そうとしているのです。それは、AI研究者は見過ごしているが、大規模言語モデル自身が、本当は何かを密かに知っていて、我々の知らないところでそれを利用している何かがあるのだという問題意識だと考えていいと思います。

それが、彼女のいう「意味の構造」なのです。


-------------------------------

ショートムービー「 現実の経験的データからの構造の抽出の試み 」を公開しました。
https://youtu.be/trOpwmo8p1k?list=PLQIrJ0f9gMcOJYKeUN_8q2K-yxtTfbIoB

「 現実の経験的データからの構造の抽出の試み 」のpdf資料
https://drive.google.com/file/d/1GTZknifKxuEnDPLAhoYi7Xk3vQHzKweH/view?usp=sharing

blog 「 Tai-Danaiのニューラル言語学批判  」
https://maruyama097.blogspot.com/2024/02/blog-post_22.html

「言語の意味の数学的構造」まとめページ
https://www.marulabo.net/docs/embedding-dnn/

ショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcOJYKeUN_8q2K-yxtTfbIoB 

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について