投稿

意味を考える 3 -- ジャンボジェット

イメージ
先の投稿、億単位のパラレル・コーパスを「学習」する機械学習技術にケチをつけるみたいな終わり方をしたので、若干、釈明を。 同じことが人間にできず(人間がこういうスタイルで、言語の「意味」を「学習」しているわけではないのは明らかだと思うのだが)、機械にそれができるのなら、それはそれでもいいのではとは思う。 空を飛ぶのに、生物の進化は昆虫や翼竜や鳥類を生み出したが、人間が発明したのは飛行機だった。同じ目的を達成するのに、生物と人間が発明した機械とが、違うアプローチをとってもいいのだ。 我々が、蝶々や鳥のように空を飛べないのは残念なことだが、空を飛ぶことについては、機械の勝ちかもしれない。翼竜のプテラノドンよりジャンボジェットの方が巨大だし、それに、ロケットなら宇宙にも行ける! (と言っても、「となり」の火星程度までなのだが) もしも我々が妖精のように自由に空を飛べていたら、「空を飛ぶ機械」の進歩の歴史は、今とは少し違っていたとは思う。(妖精は、自力では火星に行けないもんね。多分。) 機械翻訳に要するデータの巨大さだけに驚いてはいけない。それに必要なハードと計算時間も巨大である。先の論文によれば、Googleニューラル機械翻訳では、GPU100個を使って、フルトレーニングには最大1,000万ステップ、収束までには3週間かかることがあるという。 ただ、巨大さと複雑さで言えば、人間の脳だって負けてはいない。脳には、この銀河系の星の数より多い、860億個のニューロンが存在する。大脳新皮質には100億のニューロンがある。もっとすごいのは、その星の数ほど多いニューロンがお互いに結びついてネットワークを構成していることである。そのグラフなど書けっこない。 (人間の脳の構造と発達については、最近読んだ次の本がとても面白かった。「我々自身を発明する:ティーンエイジャーの脳の秘密の生活」"Inventing Ourselves: The Secret Life of the Teenage Brain" https://goo.gl/RBLn3H いつか紹介したい。) 今はどうなったかわからないが、ついこの間まで、人間が生物のニューロンの正確な接続のグラフを書けたのは、302個のニューロンと8,000のシナプを持つ C-Elegance

意味を考える 2 -- パラレル・コーパス

イメージ
「私はあなたを愛しています。」 この文の「意味」は、何かと言われると、なかなか答えるのが難しい。(日本語では、まずこういう言い方はしないと思うのだが、そのことはおいておく。) ただ、"I love you." の「意味」はと聞かれれば、「私はあなたを愛しています。」だと答えるのは易しい。 「それは、意味の意味が違う。」 確かに、そうかもしれない。 それでは、「二つの言語で、同じ意味が表現されている」と考えるのは、どうなのだろうか? この文章で使われている「意味」は、先に「なかなか答えるのが難しい」と考えた「意味」そのものではないだろうか? とりあえず、二つのことを、この後の議論のために、作業仮説として確認しておこう。  1.  二つの言語を比較すると、意味は取り出しやすく(感じる)。  2.  意味は、言語によって表現されるが、言語によらないものを指し示す。 実は、現代の自動翻訳技術は、二つの言語で、同じ意味を持つ文を大量に集め、それを学習させるのが基本技術だ。「私はあなたを愛しています。」= "I love you."  という文例をたくさん集めておく。「私はあなたを愛しています。」の「意味」を考えて、頭を抱えることはない。 ただ、そのデータ(「パラレル・コーパス」「パラレル・データ」と言ったりする)の規模は、多分多くの人の想像を超えていると思う。 機械翻訳についての基本的なカンファレンスは WMT "Workshop on Machine Translation" である。(2018年のページは、こちら。http://www.statmt.org/wmt18/ もっとも、僕は、二年近く最近の動向をフォローしていない)  WMTは、機械翻訳の研究のために、基本的なパラレル・コーパスを研究者に提供している。WMT 14  https://goo.gl/9d4cyi   WMT‘14の英語(En)<-> フランス語(Fr)データセットには、 3,600万の文のペアが含まれている。 WMT‘14の英語(En) <-> ドイツ語(De)データセットには、 500万の文のペアが含まれている。 かなりの規模だ。 ところがである。僕が、Goog

Q2Bカンファレンス

イメージ
来週から、Q2Bカンファレンスが、マウンテンビューのコンピュータ歴史博物館で始まる。去年に続いて二回目の開催。 https://q2b2018.qcware.com/ 第一回でのプレスキルの基調講演は、とても勉強になった。僕は、その全文を日本語に訳した。「NISQ時代とそれ以降の量子コンピューティングについて」 https://goo.gl/6qh1oE これは、量子コンピュータの動向について知る上の必読文献と言っていい。 今年は、僕が大好きなスコット・アーロンソンが、プレスキルと並んで基調講演に登壇する。二人の基調講演にとても期待している。 プレスキルの基調講演のタイトルは、「短期的・長期的に見た量子テクノロジー:応用の探求」、アーロンソンの基調講演のタイトルは、「量子優越性とその応用」だ。 プレスキルもアーロンソンも、量子コンピュータの世界を代表する研究者なのだが、Q2Bカンファレンスの特徴は、量子テクノロジーの「ビジネスへの応用」にフォーカスしようとしていること。 「Q2Bにようこそ」という呼びかけは、こう述べている。「Q2Bのミッションは、近未来の量子コンピュータのリソースを使った、最適化・シミュレーション・機械学習・暗号等のアプリケーションの開発を刺激することです。」「量子コンピュータを実世界の問題に応用する方法を開拓するために、研究者と産業界の実践者のコラボレーションを進めます。」 日本では、「量子コンピュータの応用は、まだまだ先のこと」と考えている人が多いのだが、アメリカでは実践的な応用への関心は、年を追うごとに大きく拡大している。 Q2Bカンファレンスの紹介のセミナー、日本でもやりたいなと思う。

意味を考える1 -- 「皇帝の新しい心」

ペンローズの「皇帝の新しい心」(1989年)の冒頭には、お母さんがコンピュータ科学者、お父さんがコンピュータを破壊しようという、今でいう「テロリスト」を両親に持つ子供が登場する。これって「銀河鉄道999」のメーテルの家庭環境と同じだ。 舞台は、国をあげて開発した、その国の全ての人間のニューロンの数より多い10の17乗個の論理ユニットを持ち、その知能は想像もつかないほど高いと言われている、巨大コンピュータUltronicの火入れとお披露目の場。 その子は、お母さんが有力な開発者だったので、セレモニーの前から三列目にいる。(お父さんは、爆発物が見つかって拘束されている)。司会者が、「誰か、Ultronicに、最初の質問をしてみませんか?」と会場に声をかける。みな、自分の無知を晒されるのがいやと思ったのか、誰も手を上げない。 その子は、Ultronicの開発と一緒に育ったようなものだったので、「彼」が何を感じているのか自分のことのようにわかるように思っているので、臆せず手を挙げる。司会者が彼を指名する。 その時、何かが起きる。 約400ページほど省略すると、あれ、これってネタバレ? でもネタバレしないと話が進まないな。まあ、いい。会場で起きたことについては、次のポストで書く。 それは、コンピュータによる「意味」の理解に関連した、とても面白い寓話だ。 (ちなみに、ペンローズの次の本「心の影」の冒頭にも寓話が掲げられているのだが、それは、プラトンの「洞窟の喩え」を寓話にしたものだ。彼は、数理哲学的には、プラトン流の「実在論者」なのだ。) ペンローズのこの本は、30年前のものだけど、人工知能論としては、頭三つぐらい飛び抜けている。サールらの「強いAI」「弱いAI」論の批判などは、痛快なものだ。 僕は、人工知能論では、「計算主義」の立場に立つのだが、この本は、全力で「計算主義」を批判している。ペンローズの「計算主義」批判は、避けて通れない問題だ。 ある意味皮肉な話だが、個人的には、この本が出た頃、哲学では飯が食えなくて、僕は哲学からITの世界に転進する。この本が扱っている問題は、当時の僕の哲学的関心には、とても身近な話題だったのだが、ITの問題としては僕は真面目に考えてはいなかったと思う。それは、僕の視野の狭さのせいだと思う。 ITの世

万延元年のアメリカ情報

イメージ
スコット・アレクサンダーという作家がいる(SF作家かもしれない。"Science Fiction"じゃなくて"Speculative Fiction"だと、誰かが言ってた)。彼のblog("Slate Star Codex")、時々見ているのだけど、そこで見つけた画像。https://goo.gl/vZRpiy 2020年11月21日が、メイフラワー号アメリカ到着の400周年に当たるらしく、アメリカでは、自国の歴史への関心が高まっているのかもしれない。 この絵は、江戸時代の1861年に日本で出版された「童繪解萬國伽」("Osanaetoki Bankokubanashi"と読むらしい)からのもの。コロンブスのアメリカ大陸「発見」から、イギリスからの独立戦争までのアメリカの歴史を、日本の読者に伝えている。 160年前の日本人の知識欲は驚くほど旺盛である。もっとも、黒船騒ぎでアメリカへの関心は高かったのだろうが。でも、江戸時代にこんな形で、アメリカについての情報が広まっていたのは知らなかった。これ、子供向けの本ということになっている。 1860年は、万延元年だ。幕府はアメリカに大型の遣米使節を派遣して同年11月日本に帰ってくる。僕は、勝海舟や福沢諭吉やジョン万次郎もこの使節団の一員だと思っていたのだが、違うようだ。彼らは、この使節団を護衛する咸臨丸に乗っていた。(「万延元年遣米使節団員名簿」https://goo.gl/ArGZ53 ) 多分、そこでの知見が、この本に生かされているのだと思う。 確かに、いろいろおかしいところはある。弓を引いて戦っているのは、ワシントンだという。「國父 話聖東」は「建国の父 ワシントン」だ。(絵師は、アメリカ見ていないのだから。インスタもなかったし。) ジョン・アダムスの母は、大蛇に飲み込まれ、アダムスはその敵討ちをするらしい。おいおい。ほとんどフェークだ。 「独立」とか「民主主義」がどう紹介されていたのか、興味があったのだが、ワシントンが虎と素手で戦い、アダムスが巨大なワシを召喚して大蛇と戦うんだから、多分、そんな話は出てこないだろう。 でも、160年前の日本人、一生懸命、こうした情報集めてたんだな。エライと思う。この本

画像を探す

イメージ
Adam Brownの学会でのプレゼン "Complexity and Geometry" を探していたのだが、表紙に格好いい絵が使われていた。https://goo.gl/Zuyg7Z よく見ると、持っているものに(元々は、ハープだったらしい)量子回路の図が書いてあって、「あっ。すごいな。この絵も彼が書いたのかな。」と感心した。 ところが、この学会 Strings 2017 自体のアイコンに、この絵が使われていることに気づく。もちろん、量子回路は書かれていない。画像は、http://www.strings2017.org/ でみれる。「あれ? おかしいな?」と思って、画像検索をする。 そうしたら、見つかったのがこの写真。これは、1965年に、ガザで見つかった7世紀初頭のビザンチン時代のモザイクらしい。ダビデ王がハープを弾いているところだという。wikiにも、このモザイクが紹介されている。"Gaza Sinagogue" https://goo.gl/56LYzn この学会、イスラエルのテルアビブで開かれた超弦理論の国際カンファレンスなので、この地の文化遺産からハープを選んだのは、まあ、わからなくもない。 ただ、二つの絵、よく似てはいるが、いろいろ細部は異なっている。だいたい、僕には、Adam Brownの表紙は女性に見える。ダビデ王は、ヒゲを蓄えているように見える。 問題は、学会のアイコンが発掘されたダビデのモザイクより、回路図を除けばBrownの表紙の方に似ているように見えること。 この三枚の絵は、どういう関係なんだろう? ---------- 酒井さんの指摘もあって、こう考えることにしました。 ・この絵は、3枚とも、ダビデのもので、少女ナウシカではないですね。元の絵は、発見された古いやつです。 ・元のモザイクは断片で古いものだから、修復されて綺麗になった画像(あるいはモザイクそのものかもしれません)が、使えるようになっていたと思います。美少年だったダビデは、少女のようにも見えます。ヒゲはありません。 ・大会の主催者は、この修復バージョンを使いました。もちろん、この絵がダビデのものであることを知っています。 ・ブラウンは、大会のアイコンを見て

科学と哲学

12月14日開催の連続ナイトセミナー「人工知能を科学する」の今回のテーマは、「人工知能と哲学」です。https://lab-kadokawa72.peatix.com/ 「人工知能を科学するのに、哲学必要ですか?」と思われた人も少なくないと思います。たしかに。 科学や数学は、確立された体系(少なくとも「これまでに確立された」という意味ですが)を持っています。その成果は、多くの人に等しく共有されています。今では誰もが、「地球が太陽のまわりを回っている」「リンゴが木から落ちるのは重力があるから」と考えています。もちろん「1+1=2」で「直角三角形ではピタゴラスの定理が成り立つ」ことも。そういう知識のあり方を「累積的知」と呼ぶことがあります。 哲学には、残念ながら、確立された体系も万人が認める真理も存在しないように見えます。人によって物事の捉え方が異なるのですから、哲学にも色々な立場があります。「残念ながら」と書きましたが、それはそれでいいことだし、これからも哲学が「完成」するようには思えません。 そうした意味では、科学と哲学は、かなり違っています。 ただ、科学と哲学は、想像以上に広い接点を持っています。それは、おそらく、技術がビジネスや経済合理性と強い結びつきを持っているのと同じだと思います。「科学と哲学」と「技術とビジネス」の二つの結びつきをくらべれば、その結びつきのの質はずいぶん違うし、「科学と哲学」のつながりはあまり意識されることは少ないのですが。 科学も数学も「発展」して、その体系を「更新」します。現在の科学が全ての問題に解答を用意しているわけではないのです。現在の科学では説明できない「謎」の存在こそ、科学を発展させる原動力です。「謎」に立ち向かうには、様々な「立場」、ある場合には矛盾する「仮説」が必要になります。そのような局面では、科学者も哲学していると考えていいのだと、僕は考えています。 今回のセミナーでは、三つの話をしようと思います。 一つ目は、「コンピュータは人間を超える」という「シンギュラリティ論」や、「そんなことはない。人間の脳の働きはコンピュータのアルゴリズムを超えている」というペンローズらの「量子脳」理論を、「計算主義」の立場から批判してみようと思います。 二つ目は、言語の意味の理解を例に、文法の理論と双対の意