言語の習得と数学の学習

【 言語の習得と数学の学習 】

大規模言語モデルや機械翻訳システムでの言語の学習は、基本的には、膨大なパラレル・コーパスの学習である。パラレル・データの一方が模範解答として教師の役割を果たす。

それは人間なら嫌になって逃げ出したくなるほどの、教師による誤りの指摘と修正の、気の遠くなるような繰り返しである。幸いなことに、人間と違って機械は、登校拒否することも気絶することもない。

機械学習にはいくつかのタイプがあるのだが、画像認識でもSequence to Sequence でも強化学習でも、膨大なデータと繰り返しの学習によって「誤り」の低減を目指すというメカニズムは同じである。

機械はそうした退屈だが過酷な試練を耐えぬく、ある意味では人間(すくなくとも僕)に欠けている、優れた能力を持っているのである。素晴らしい!

ChatGPTの、時には嘘も交えて流暢に言葉を話す能力は、時にはヘラヘラしている印象を与えるかもしれないが、彼の生まれも育ちも「根性」も、試練に耐えた筋金入りのものだ。

ただ、こうした機械の言語学習のモデルが、言語学習の一般的なモデルであるとは、僕は思っていない。僕らは、それとは全く違うスタイルで「母語」を操る能力を手に入れているからだ。

僕らは、けっして数億ペアの大規模パラレル・コーパスを与えられて、ことばを習得したわけではない。それは経験的にはあきらかだ。その上、論理的には、僕らが学ぶ最初の言葉である母語に、対応するペアなどあるわけがないのだ。また、「母」にあたる環境は、ことばの間違いをしつこく指摘する「鬼教師」ではなかったはずだ。

人間が、だれでもことばを理解できるというのは、言語能力が人間のもっとも基本的な能力であるということである。

機械が示し始めた言語能力に感心する前に、そういう時代だからこそ、僕ら自身の言語能力の習得の不思議さに、もっと関心が集まっていいと僕は思う。言語学者は昔からそうした関心を持っていたはずだ。そこには、Chomsky「言語能力の生得性」の主張をはじめとしてたくさんの知見の集積がある。

話は変わるのだが、大規模言語モデル的な学習モデルが、学習の普遍的なモデルではないことを示すのは、人間の言語習得のプロセスだけではない。数学の学習プロセスも、現象的にも原理的にも、多くの不思議に包まれている。

近代以降、学校教育の成立の中で、数学教育は社会システムに制度として組み込まれてきた。それ以前の時代、西欧では、意外に思われるかもしれないが、ギリシャの数学の伝統は放棄され顧みられなかった。それを伝えていたのはイスラム世界だった。

現代では、子供達の多くの時間が、数学の教育にあてられている。それは、数学を理解できることが、人間の基本的な能力として、社会から期待されているからだと思う。

ただ、言語能力の学習が、人間にとってもっとも顕著な学習の成功例だとすれば、数学的能力の学習は、そういう地位を占めてはいないのは確かだと思う。

数学の学習についての議論は、単純化すると両極からおきる。
 「なぜ、数学を理解することができるのか?」
 「なぜ、数学を理解できないのか?」
後者のタイプの議論は、言語学習の場合には、起こり得ない。

ある意味先天的な母語の習得と後天的な数学の学習は、まったく異なるタイプの学習である。それはまた、現代の大規模言語モデル的言語学習とも異なるものだ。

四書五経の素読を繰り返すような(=大規模言語モデル的)スタイルで、数学が学べるわけではないのは明らかに思える。

ただ、先に、機械は、単純な作業を何度でも繰り返すことができる存在だと揶揄したのだが、重要なことは、数学については、機械はそれだけではない人間とは異なる能力を持っていると僕は考えている。残念なことに、大規模言語モデルに目が眩んで、我々は、今はあまりその能力に注目していないだけなのだ。

大規模言語モデルなどという回りくどい、かつ数学的には非力な脇道を通らずとも、機械は、それ自身、数学を学習し、数学の推論を実行する強力な能力を持っているのである。

こうした機械と数学の見方については、おいおいVeovodsky の数学論を紹介する中で述べてゆきたいと思う。今回は、一年前の僕の不思議な体験の話で終わろうと思う。

Facebookへの僕の投稿から。

「昨日、不思議な感動的な体験をしました。

月末のセミナーに向けて、数学者が証明問題を解くのに、コンピュータを利用し始めていることを紹介しようとしているのですが、どうしても取り上げたいトピックがありました。

一年ほど前、連続体仮説の独立性をコンピュータ上で証明できたという論文が出ていました。彼らは、その証明を GitHubで公開していました。「証明」はコンピュータで実行可能な「プログラム」の形をしているのです。

昨日、それを実行してみたのです。

僕のくたびれた非力なMacは、証明の準備にとりかかりました。メッセージをみると、証明に必要な情報をたくさん集めているのがわかります。一時間ほどかかって、ようやく準備ができましたようです。「証明して」とコマンドを打ち込んだら、15分ほどで、証明が終わりました!

不思議な気持ちになりました。

確かに、僕が命令して僕のマシンが働いたのですが、僕は「連続体仮説の独立性」を証明したのでしょうか?」

興味がある人は、次の僕のムービーとページを見てほしい。

「連続体仮説をコンピュータで解く」
https://www.youtube.com/watch?v=OVU7q8ava0I&list=PLQIrJ0f9gMcPP8LOejaQQlYufAMEQbcdg&index=12 

まとめページ「コンピュータ、数学の問題を解き始める」https://www.marulabo.net/docs/math-proof/

------------------------------

「 言語の習得と数学の学習」を公開しました。
https://youtu.be/I-R_vYwBv1U?list=PLQIrJ0f9gMcMMwP2zBgMe3LbaDnKGG_zw
 
資料pdf
https://drive.google.com/file/d/1FSF8VIoGoGsNQdCF58W9HFQmAblymD3c/view?usp=sharing

blog:「 言語の習得と数学の学習」
https://maruyama097.blogspot.com/2023/02/blog-post_13.html

まとめページ
https://www.marulabo.net/docs/AI+Math/


コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について