投稿

ラベル(Mathematics)が付いた投稿を表示しています

実は、ディープラーニングは数学が理解できないのだ

少なくないIT技術者が、人工知能技術の進化は、「ルール中心」から「データ中心」への進化だと思い込んでいる。確かに、「データ中心」のディープラーニング技術が人工知能技術にもたらしたものは、巨大なものだった。それを否定するつもりも、その必要もないもない。 ただ、この何年かの変化だけをみて、人工知能への基本的なアプローチが、「データ中心」のディープラーニング技術で確定し、人工知能技術の未来が、「データ中心」のディープラーニング技術の未来と共にあると考えるなら、それは間違いだ。 明らかに、ディープラーニングには、苦手な領域があるのである。僕は、その一つは、言語の意味理解の能力だと思っているのだが、それについては別の機会に触れる。もっとわかりやすいのは、ディープラーニングの手法で構成された「知能」は、数学を理解することも、数学を学習することもできないということだ。 「人を批判するのはやさしい。  そんなら、自分のアイデアでなんか作って見せてよ。」 もっとも、ディープラーニングは数学ができないという僕が、すらすらと数学の問題を解き、新しい数学の定理を発見する「機械」を作って、皆に見せられるのかというと、そうではないのだ。 「やーい、やーい。  やっぱりできないんじゃないか!」 そうなのだ。でも、子供の喧嘩じゃないのだから、もう少し冷静に議論しようと思う。 今はまだできていないと問題の難しさを認めることは、なんでもできますというよりは、ましなことだ。 大事なことは、「データ中心」と対比されて、エキスパート・システム程度のイメージで「ルール中心」と一把一からげにされてる、論理的・数学的推論を機械に実行させようというもう一つの人工知能技術に、着実で大きな進化があるということである。(RPAの中で、ディープラーニングを「補完」する技術として「ルール・エンジン」が復活しているのだが、僕が、いいたいのはそのことではない。) コンピュータが存在しなかった、今から90年近く前の1930年代、当時まだ若者だったゲーデルやチューリングが発見したことは、「証明可能性」と「計算可能性」が同一の概念だということであった。もう一つの人工知能技術の源流が、そこにある。 ただ、それは数学的・原理的な同一性で、実際のコンピュータに数学の証明をさせるには、いろんな回り道

Yet Another AI

現在のAI技術の主流は、ディープラーニング技術なのですが、それ以外のもう一つのAI技術("Yet Another AI")として、論理的・数学的推論をコンピュータで行おうというAI技術の流れが存在します。今回は、そうした技術を取り上げます。 ディープラーニングは、生物のニューロンとそのネットワークをモデルにしています。視覚や聴覚・嗅覚といった生物の知覚のシステムを機械でシミュレートし、また、生物の全身の筋肉を連携させてバランスをとって運動する運動能力を機械・ロボットで実現するにはとても優れた技術です。それは、生物との類似で言えば、蜜を求めて花を回るハチや、上空から獲物を見つけて急降下するハヤブサの、体内のニューラル・ネットワークの働きと同等のものを機械の上で実現しようという技術だと思っていいと思います。 ただ、人間には、そうした、ほとんど全ての生物に共通する感覚・運動能力とは別に、感覚と運動とをワンクッション置いて統合する機能があります。確かに、ハチも「迷う」かもしれないし、ハヤブサも「賢い」かもしれないのですが、人間は、知覚系の入力から条件反射的に運動系を動作させて行動するだけではありません。人間は、考えます。考えることができることが、人間の知能の大きな特徴だと僕は考えています。 そうした人間の「考える」知能の中核は「推論」する能力にあります。もう少し、抽象的に言えば、人間は論理的・数学的に推論する能力を持っています。それは、「人工知能」技術の重要な対象だと僕は考えています。 ディープラーニング技術は、「推論」する人間をシミュレートできるでしょうか? 答えはおそらくノーです。 ドンキーカーでも自動運転するBMVでも、ディープラーニング技術はとても重要です。ただ、彼らに右側通行か左側通行かといった「交通法規」を覚えさせるのに、ディープラーニングは役立つでしょうか? 多分、もっと上位の層で、ルールを覚えさせることが必要になります。 ネットワークのセキュリティでも、異常検出にディープラーニング的アプローチは役に立ちます。ただ、異常らしきものを検出したとして、それにどう対応すべきかは、「自動化」「機械化」しようと思ったら、たくさんのルールの構築が必要になります。 「推論する機械」の可能性の問題は、意外と我々の身近なところに現

テンソルとは何か?

今度、久しぶりにディープラーニング系の話をします。 調べてみたらマルレクでディープラーニングの話をしたのは、2年前が最後でした。https://www.marulabo.net/docs/20170528-marulec01/ 「先生、たまには人工知能の話もしてください。」(いつもしてますけど。) 「あと、数学、関心高いんですよ。」(「楽しい数学」、やってますけど、楽しくない?) 今回のセミナーは、こうした(角川 en藤さんからの)リクエストに応えたものです。 -------------------------------- 7/9 角川セミナー「初めてディープラーニングを学ぶ人のための数学入門〜ニューラルネットで行列を理解する〜」 https://lab-kadokawa83.peatix.com/ -------------------------------- 普通に線形代数の話をしても面白くないので、今回は、ちょっと新しい考え方を紹介できればと思っています。 それは、「テンソルとは何か?」という疑問に、絵解きで答えるアプローチです。 ディープラーニングのフレームワークとしては、 GoogleのTensorFlowは有名ですし、スカラー、ベクトル、行列 ....といった系列の拡張として「テンソル」という概念があることは、ご存知の方も多いと思います。 ディープラーニングの数学では、「テンソル」というのは大事な概念です。 今回紹介しようと思っているのは、Tensor Network という考え方です。 考え方は簡単です。マルを一つ考えます。マルから一つだけ「手」が出ているのが「ベクトル」で、マルから二つ手が出ているのを「行列」と考えるんです。一般に、マルからたくさん手が出ているのを、「テンソル」と呼びます。(手が無いマルは「スカラー」です。) マルとマルは、手をつなぐことができます。手をつなぐということは、ある演算に対応しているのですが、マルとマルがつながることで、テンソル(マル)のネットワークが出来上がります。これを Tensor Network と呼びます。 7/9 セミナーの参考資料 Youtube から視聴できるようにしました。 「テンソルとは何か? Tensor Network 入門(1) --

7/29 マルレク 「Yet Another AI -- RPAは「推論エンジン」の夢を見るか」の告知ページ公開しました

https://yet-another-ai.peatix.com/view 現在のAI技術の主流は、ディープラーニング技術なのですが、それ以外のもう一つのAI技術("Yet Another AI")として、論理的・数学的推論をコンピュータで行おうというAI技術の流れが存在します。今回は、そうした技術を取り上げます。 ディープラーニングは、生物のニューロンとそのネットワークをモデルにしています。視覚や聴覚・嗅覚といった生物の知覚のシステムを機械でシミュレートし、また、生物の全身の筋肉を連携させてバランスをとって運動する運動能力を機械・ロボットで実現するにはとても優れた技術です。 それは、生物との類似で言えば、蜜を求めて花を回るハチや、上空から獲物を見つけて急降下するハヤブサの、体内のニューラル・ネットワークの働きと同等のものを機械の上で実現しようという技術だと思っていいと思います。 ただ、人間には、そうした、ほとんど全ての生物に共通する感覚・運動能力とは別に、感覚と運動とをワンクッション置いて統合する機能があります。確かに、ハチも「迷う」かもしれないし、ハヤブサも「賢い」かもしれないのですが、人間は、知覚系の入力から条件反射的に運動系を動作させて行動するだけではありません。 人間は、考えます。考えることができることが、人間の知能の大きな特徴だと僕は考えています。 そうした人間の「考える」知能の中核は「推論」する能力にあります。もう少し、抽象的に言えば、人間は論理的・数学的に推論する能力を持っています。それは、「人工知能」技術の重要な対象だと僕は考えています。 ディープラーニング技術は、「推論」する人間をシミュレートできるでしょうか? 答えはおそらくノーです。 ドンキーカーでも自動運転するBMVでも、ディープラーニング技術はとても重要です。ただ、彼らに右側通行か左側通行かといった「交通法規」を覚えさせるのに、ディープラーニングは役立つでしょうか? 多分、もっと上位の層で、ルールを覚えさせることが必要になります。 ネットワークのセキュリティでも、異常検出にディープラーニング的アプローチは役に立ちます。ただ、異常らしきものを検出したとして、それにどう対応すべきかは、「自動化」「機械化」しようと思ったら、たくさんのル

6/21 マルレク・サブゼミ 「3時間で学ぶ Shorのアルゴリズム入門」について

6/3 マルレク「暗号技術の現在」のフォロー・アップのセミナーとして、6月21日次のセミナーを開催します。  日時; 2019年6月21日 19:00~22:00  場所: 五番町グランドビル 7F / KADOKAWA セミナールーム  テーマ:「3時間で学ぶ Shorのアルゴリズム入門」  申し込みページ: https://shor.peatix.com/view 講演概要 6/3のマルレク「暗号技術の現在」では、暗号技術が現在の「公開キー暗号/RSA暗号」から「ポスト量子暗号」に大きく変わろうとしているという話をしました。こうした変化を引き起こした最大の原因は、25年前に発見された「Shorの素因数分解アルゴリズム」です。 RSA暗号は、大きな素数p,q 二つの積である大きな数Nが、たとえNを知っていても、現在のコンピュータでは、その素因数p,qを求めることがとても難しいという事実をその基礎にしています。公開キー暗号は、コンピュータでも分解できないこのNを、事実上、皆の前に公開するという暗号方式です。Shorは「量子コンピュータを使えば」、Nの素因数分解が極めて高速に可能になることを発見しました。それは、「公開キー暗号/RSA暗号」が、簡単に破られるということを意味しています。 ではなぜ、こうした発見が25年間も「暗号技術に対する脅威」とは見なさなかったのでしょうか? その理由は簡単なものです。それは、「量子コンピュータ」が、すぐにも実現する技術とは見なされなかったからです。現時点でも、大きなNに対して、Shorのアルゴリズムでその素因数を求められる量子コンピュータは存在しません。 ただ、20年後40年後は、どうなっているでしょう?  近年になって、量子コンピュータの「実現可能性」について、大きな認識の変化があります。基本的には、いままでよりかつてなく多くの人が「いつか、確実な時期はわからないが、量子コンピュータは実現するだろう」と考えるようになってきました。Shorのアルゴリズムに対する関心が、新たに高まっているのは、そうした背景があります。NSAやNISTが、「ポスト量子暗号」への動きを本格化しているのは、当然のことだと思います。 1. 量子コンピュータではなぜ高速な計算ができるのか?  量子コンピュータでは

6/3 マルレク「暗号技術の現在」の講演資料です。

イメージ
6/3 マルレク「暗号技術の現在」の講演資料です。ご利用ください。 http://bit.ly/30YB8gP お申し込みは、次のサイトからお願いします。残席わずかです。 https://qcrypt.peatix.com/   --------------------------------   「暗号技術の現在」 はじめにから   -------------------------------- 暗号には「秘密」がつきものであった。1955年、数学者のJohn Nashは、 NSAに対して「鍵の計算に指数関数的時間のかかる」方法を使えば、「誰にも破れない暗号を簡単に作れるようになる」という手紙を送っている。1970年代の初めには、イギリスの情報機関GCHQの科学者たちが、今日の公開キー暗号と同じものを作り上げていた。それはNSAも知っていた。ただ、それらは全て「機密」とされ、世に知られることはなかった。 なぜ、「機密」にされたかといえば、securityの問題は、第一義的に”National Security”の問題だからということなのだが、なぜそうした技術が、広く実用化されなかったという点に関して言えば、別の問題があったことに気づく。それは、当時のコンピュータには、少なくとも経済的には、こうした複雑な計算を実行する計算能力が十分ではなかったのである。 現在の暗号化技術の基本が出来上がるのは、1976/1977年のことである。その技術の真価は、80年代のコンピュータのコンシューマライゼーション(PC-AT, Windows, …)を経て、90年代半ばのインターネットのグローバルな拡大、経済活動のグローバル・ネットワーク化、個人のネットワークへの登場を通じて、全面的に開花する。この技術なしでは、今日のネットワークの成功はなかったろう。 このことは、同時に、暗号化技術が、もはや、もっぱら ”National Security”のみにかかわる技術ではなくなったことを意味する。今では、誰もが暗号化技術を必要とし、誰もがそれを、オープンな「標準技術」として利用できる。それは、大きな変化である。 暗号化技術は、その時代で利用可能なコンピュータの計算能力、その時代で利用可能な通信基盤に大きく依存している。それは歴史的に変化するものだと僕は考え

ビットコイン、イーサリウムと楕円曲線暗号

イメージ
ビットコイン、イーサリウム等の暗号貨幣のほとんどは、暗号化に楕円曲線暗号を用いている。 多くの人は、大きな数の素因数分解の難しさを基礎とするRSA暗号より、離散対数問題を解くことの難しさを基礎とする楕円曲線暗号の方が、強い暗号(その上暗号化の鍵のビット数も減らせて効率的)だと信じているように見える。 ただ、量子コンピュータからの「攻撃」に対して、楕円曲線暗号の方がRSA暗号より強いかと言えば、答えはノーである。楕円曲線暗号を、量子コンピュータは破ることができるのである。 このことについては、今度のマルレクで触れたいと思う。暗号貨幣・ブロック・チェイン技術について関心のある方も、ぜひ今度のマルレクに参加してほしいと思う。 https://qcrypt.peatix.com/ NSAの楕円曲線暗号についての次のような重要な勧告は、明確にビットコイン、イーサリウム等の暗号通貨のセキュリティの現状についての警告なのだが、そのことに皆が気づいているわけではないように思う。 「Suit Bの楕円曲線アルゴリズムへの移行を、まだ行なっていないパートナーならびにベンダーは、現時点で、そのための大きな支出せずに、その代わりに、来るべき量子耐性アルゴリズムへの移行を準備することを、我々は勧めてきた。」 「不幸なことに、楕円曲線の利用の拡大は、量子コンピューティング研究の絶え間ない進歩の事実と衝突するものである。すなわち、量子コンピューティングの研究は、楕円曲線暗号化は、多くの人がかってそうなるだろうと期待したような長期間にわたって有効なソリューションではないことを明らかにした。こうして、我々は、戦略の見直しを余儀なくされてきた。 」  NSA "Commercial National Security Algorithm Suite" http://bit.ly/2YExs1M Shorのアルゴリズムは、多くの人は素因数分解の量子アルゴリズムと考えているようなのだが、それはコインの片面でしかない。重要なことは、同じアルゴリズムが離散対数問題も解くということである。 Shorの原論文のタイトルは、"Polynomial-Time Algorithms for Prime Factorization and Di

「楽しい数学」「同じ」を考える--「型の理論入門」

明日開催の「楽しい数学」「同じ」を考える--「型の理論入門」 https://mathnight4.peatix.com/   の講演資料です。ご利用ください。 https://goo.gl/nbrFcU 本資料の第三部は、次次回開催のマルレク「コンピュータで数学する -- Yet Another AI」につながっていきます。この分野に興味のあるかた、目を通しておいてもらえますか?  ------------------  「はじめに」から  ------------------ 「同じ」あるいは「同じではない」という判断は、知覚にとっても認識にとっても、最も基本的な判断の一つである。認識の対象が、自然であれ、人間であれ、あるいは、思惟が産み出す抽象的な概念であれ、その認識の土台には、対象の「同一性」についての判断があるように思う。 小論の第一部では、まず、日常の生活の中にも現れる「同じ」をめぐる問題を、いくつかのサンプルで考えてみようと思う。その後で、「哲学者」たちが、こうした問題をどのように考えていたのかを、きわめて簡単に振り返ろうと思う。 残念ながら、小論は、「同一性」についての、「哲学的」議論を紹介することを目的とはしていない。ただ、第一部での議論を通じて、日常の中にも、浅からぬ哲学への入り口が存在していることを意識することを楽しんでもらえれば嬉しいと思う。 小論の第二部では、20世紀の科学が、すくなくとも自然認識の領域では、「同一性」概念の大きな変化を引き起こしたことを述べようと思う。 相対論は、宇宙規模の巨大な空間では、時間の「同時性」が成り立たないことを示し、量子論は、極めて微小な領域では、すべての物質と力は、「同じ」性質を持つ不断に変化する素粒子の運動として記述できることを示した。同時に、両者ともに、その法則性は、ある種の「不変性」として記述される。 物理的な「同一性」は、基本的には「情報」の「同一性」として表現されるのだが、この分野でも、量子情報理論の発展は、エンタングルメントや量子テレポーテーションといった、「同一性」にかかわる思いがけない知見を我々にもたらしている。 小論の第三部は、数学での「同一性」にまつわる議論を、「型の理論」の成立と発展を中心に概観したものである。 「

「量子コンピュータを、高校生にも易しく理解させることを目指すいくつかの試みについて -- String Diagram 入門」

イメージ
次回のマルレクですが、こんなテーマにしようと思っています。 「量子コンピュータを、高校生にも易しく理解させることを目指すいくつかの試みについて -- String Diagram 入門」 長いですね。もう少し考えますが、これ以上長くならないようにします。 講演概要は、こんな感じです。 ------------- 量子コンピュータへの関心が高まっています。 その一方で、それへの「近づきがたさ」を感じている人もたくさん存在しています。むしろ、量子コンピュータへの関心の高まりとともに、そうした層は、増大しています。 こうした中で、量子コンピュータの基礎を、高校生にも分かりやすく理解してもらうことを目指す試みも、活発に探求されています。 講演では、こうした取り組みの中から、三つの試みを紹介します。 一つ目は、Terry Rudolph のアプローチで、PETEという名前の不思議な箱を通じて、量子ゲートの働きを説明しようというものです。ここでは、量子の状態は、「霧」で表現されています。高校生を対象としていますが、筆者は、小学生でも理解できた言っています。 二つ目は、量子力学から量子論の部分を分離して、少数の原則から、基本的には高校生でもわかる線形代数の問題として、量子ゲートの働きを説明するやり方です。僕の「紙と鉛筆」のシリーズは、こうしたアプローチを取っています。 三つ目は、Bob Coeckeの「量子過程を絵解きする」というアプローチです。数式を使わずに、徹底的に図解することを通じて、量子論に対する直感を養おうとしています。Coeckeには、「幼稚園児のための量子力学」という論文もあります。(これは、さすがに難しいと思うのですが) レクチャーでは、違った切り口からのいくつかのアプローチを知ることを通じて、量子論への理解が深まることを目標にしようと思っています。 図は、Cockeが使っている、String Diagram のイメージ図です。

Proof Generalのアイコン

イメージ
次の次のマルレクで、数学の証明にコンピュータを使う「証明支援システム」の話をしようと思っている。 この分野、しばらくご無沙汰していたので、VoevodskyのプロジェクトUniMath (  https://github.com/UniMath/UniMath  )をスクラッチからインストールした。 coqide の他にも、EMACSをインターフェースに使う Proof General と言うのもあるよと書いていたので、やってみて、EMACSを開いたら、最初に出てきたのがこの画面。ちょっとびっくり。 思わぬところでオタクをみつけた。これ、日本のカルチャーの影響だよね。日本、ある意味、スゴイのかも。Contributorに日本人の名前は見つけられなかったけど。(それでいいのかな?) 面白そうなので、触ってみたが、僕、vi派だったので、EMACS苦手なんだ。

応用カテゴリー論と環境問題

バエズの地球環境への関心が、彼の「応用カテゴリー理論」とどのように結びついているかの話をしようと思う。 バエズは、数学者に何ができるだろうかと自問する。彼は、それを「有限な地球上の生命に必要とされる数学を作り上げること」だと考える。 それは、どのような数学か? 彼の考えの飛躍のポイントは、「ネットワーク」への注目にある。 「環境システムを理解するということは、最終的には、ネットワークを理解すると言うことになるだろう」 「我々は、環境システムから、素粒子物理からと同じように数学的なインスピレーションを得ることができる。そして、我々がそこで見いだすことは、もっと役に立つだろう」 「エンジニアも化学者も生物学者もそのほかの人たちも、ネットワークを記述するのに、多くの異なった図的な言語を利用している。我々は、今、それらをカテゴリー理論で統一しようとしているのだ!」 この7年間、バエズを中心とするグループが、カテゴリー論の「応用」を目指して行ってきた研究分野は、きわめて広範で、かつ実践的なものである。  ・ 信号の流れのグラフと電子回路図  ・ ペトリ・ネットと化学反応ネットワーク  ・ ベイジアン・ネットワークと情報理論 もちろん、これで全てではない。ちなみに、この間僕が紹介してきた、Coeckeの"String Diagram"による量子論の書き換えの試みも、形式意味論でのDisCoCatの取り組みも、バエズの言う「応用カテゴリー論」の一部である。 技術とその基礎としての科学の接点は、今、大きく変わりつつある。その目覚ましい変化の中心の一つに、カテゴリー論の「応用」があるのだと考えている。バエズが「21世紀の数学」というのは、そのことを指しているのだと思う。 僕は、ITの世界には長くいるし、「ネットワーク」と言う言葉を、何度も何度も使ってきたのだが、残念ながら、こうしたパースペクティブで「ネットワーク」という概念を捉えたことがなかった。 もっと恥ずかしいことなのかも知らないが、若い優秀な技術者に、「先生、そんなんでいいんですか」と言われるほど、環境問題には無関心だった。 数学理論としてのカテゴリー論の初歩は、僕は理解できるのだが。 いつもなら、「まあ、いいか」で終わるところだが、まあ、そう言う

量子論をわかりやすくする試み

Coecke(ケックとよむのかしら?)とKissingerのこの本が、抜群に面白い。"Picturing Quantum Processes" 「量子過程を絵解きする」 https://goo.gl/hmRkKy Google Booksが、珍しく、ほぼ全文を公開している。円高なので本を買おうと思ったのだが、ほとんど見えないところがないことがわかって、僕はこっちで間に合わせた。 https://goo.gl/nhrKrB とおもったら、見えたのは昨日読んだ最初の100ページほどだった。しょうがない。本を買った。 少し前に、「15歳の時の自分に向けて書いた」というTerry Rudolphの"Q is for Quantum"  https://goo.gl/4ACBFm  を紹介したのだが、ケックとキッシンジャーのこの本も、難しい数学を使わなくても、量子論は理解できるという立場に立った本だ。 ケックには「幼稚園の量子力学」"Kindergarten Quantum Mechanics"  https://goo.gl/P4mGbn  という論文がある。さすがに幼稚園児には無理かもしれないのだが、その論文から10年以上かけて初志貫徹で、直観的で誰にでも理解できる量子論の立派な「体系」を作り上げた。立派なものだ。 「量子過程を絵解きする」の副題に、"A First Course in Quantum Theory and Diagrammatic Reasoning" とあるのだが、彼の方法のポイントは、「絵解き Picturing」「図解による推論 Diagrammatic Reasoning」である。 数学もプログラミングも、キーボードで「一次元」に論理を組み立てていく。そうではなく「二次元」の図形で考えてみようよということだ。 というと、なんか怪しく感じる人もいるかもしれないが、数学的にはしっかりしたものだ。カテゴリー論のみんなが大好きな"string diagrams" そのものだ。(このstring diagramは、Super string理論のstringとは直接の関係はない。いろいろ「因縁」があるので、そのことについては

1/29「楽しい数学」のお誘い

1月29日、丸山の連続セミナー「楽しい数学」で「「同じ」を考える 」というテーマでセミナーを開催します。 https://mathnight4.peatix.com/ 日常のあたり前に見えることにも、すこし考えると当たり前ではないことが潜んでいます。今回は、「同じ」の数理を考えます。皆さんの参加をお待ちしています。 ---------------- セミナー概要 ---------------- 数学では、「同じ」「等しい」というのは、もっとも基本的な概念の一つです。  「2 x 3 は、3 x 2 と同じである」  「2辺とその狭角が等しい三角形は、同じ三角形である」  「自然数と有理数は、同じ数だけ存在する」  「ドーナツとコーヒーカップは、実は、同じ形である」 ただ、これらの例での「同じ」は、全く「同じ」ではありません。 日常でも、「同じ」という言葉は、よく使われます。  「彼と僕の身長は同じです」  「同じ時間、同じ場所で、共に過ごした仲間」  「みな、同じ気持ちです」  「この英語と日本語の文章は同じ意味です」 ここでも、「同じ」という言葉は、全く「同じ」ではありません。 これらの表現を、「同じ」という言葉を使わない表現で言い換えてみようとすると、とても難しいことに気づきます。それは、「同じ」という概念が、他の言い換えができないほど基本的な概念であることを意味しています。 セミナーでは、自明なように見えるが、多様さも併せ持つ、「同じ」の数理を探ります。セミナーでは、また、一昨年急逝した数学者のVoevodskyの「同一性」をキーコンセプトにした数学の基礎づけの試みを紹介します。

1/8 マルレク「意味の形式的理論」資料公開

明日のマルレクの講演資料です。 https://goo.gl/CPXndH  ご利用ください。資料長いのですが、背景がピンクのスライドをザッピングすれば、大まかな流れは伝わると思います。 ---------------- 「はじめに」 ---------------- 人工知能技術にとって、自然言語の意味の理解は、重要な課題である。小論は、自然言語の意味を形式的に把握しようという試みを概観したものである。 第一部では、まず、現在の主要な三つの自然言語処理技術の現状を紹介し、あわせて、言語の意味理解にフォーカスして、様々な取り組みを取り上げた。 こうした技術を評価する上で、筆者の取っている基本的な視点は、次のようなものである。   文と意味の「構成性(compositionality)」   意味の「同一性」 / 意味の共通表現の存在 残念ながら、文が語から文法に基づいて構成されることは、現在主流の自然言語処理技術では、ほとんど考慮されていない。文法性の認識がないのでは、文の意味の構成性の認識を持つことは難しい。 ただ、文の意味の構成性の認識なしにでも、意味については考えることができる。一つには文を構成する「語の意味」、もう一つには「意味の同一性」に基づく「意味の共通表現」の模索である。第一部の後半では、これらの取り組みを取り上げた。 「語の意味」の表現では、その客観性・共通性を「実在」の関係に基礎をもつOntology、語の利用の頻度の統計的分析に帰着させるWord2Vec的「分散表現」、辞書項目に諸特徴を枚挙するスタイル、 conceptual spacesを構成するアプローチ等多様な試みが行われている。 「文の意味」の表現については、論理式(あるいは、ラムダ式)による表現と多次元ベクトルによる分散表現の二つがある。後者は、実装者にはそういうものとしては、あまり自覚されていないようにみえるのだが。 機械翻訳技術の成功は、二つの言語の意味の「共通表現」を多次元ベクトルによる分散表現として抽出しているところにあると筆者は考えている。もっとも、語の意味も、文の文法性も、このアプローチでは、直接には考慮されていない。 筆者は、論理式による表現が「好み」なのだが、文から論理式への還元は、文法に応じて様々の流儀がある。この点

「同じ」という言葉は何を意味するのか? 2

先に、「同じ」型A に属する二つの項 aとb(a : A かつb : A)が「同じ」だという a = b : A で表現される「同じ」さと、二つの型AとB(A : Type かつB : Type)が同じだという A = B : Type で表現される「同じ」さは、同じ「同じ」でも、違う「同じ」であるという話をした。 前者は、例えば、Aを「三角形」という型だとして、三角形a と三角形b が「同じ」だと言っているのだが、後者は、例えば、Aを{異なる三つの点を結んでできる図形}、Bを{平行でない三つの直線で囲まれた図形}とした時、AとBは、同じ型の図形であることを主張している。 型を持つプログラミング言語の場合、あるインスタンスがどの型に属するかを意識することは大事なことだ。面倒と言えば面倒なのだが、そのことがプログラムの誤りを少なくするのに効果的なのだ。 型を持つプログラミング言語のうちのいくつかは(例えば、COQ, Agda, Haskell, 部分的にはScalaも)は、不思議な型 dependent type をサポートしている。dependent type は、パラメータによって(パラメータにdepend して)、型が変わる型だ。 パラメータxが型Bを持つなら、このdependent type E(x)を次のように表す。    (x : B) E(x) また、あるsが、dependent type Eを持つことを、次のように表す。    (x : B)  s(x) : E(x) あまり正確ではないが、B={ 整数、実数、複素数 }として x : B なるパラメータ x によって、dependent type E(x)は、整数型、実数型、複素数型 に型が変わるのだ。 昔のwakhok時代、同僚の浅見さんから、dependent type がすごいことはよく聞いていた。ただその頃、僕はそれをよく理解できなかったのだと思う。僕が、その重要性に気づいたのは、だいぶ後になってからだ。 5年前の2013年のマルレク「「型の理論」と証明支援システム — Coqの世界」で、ようやく後追いを始めることになる。 https://www.marulabo.net/docs/typetheory-coq/  

「同じ」という言葉は何を意味するのか?

あるものAとあるものBが「同じ」だというのは、何を意味するのだろう。 もしも、AとBが数字なら、その意味ははっきりわかる。 例えば、A=1でB=1なら、AとBが「同じ」だということになる。それは、1=1のことだ。 もしも、AとBが集合なら、AとBが同じだということは、Aに含まれる要素がBに含まれる要素が全て等しいということだ。集合 A={ りんご、みかん、バナナ } は、集合 B = { バナナ,  みかん. りんご } と「同じ」である。 もしも、AとBが三角形なら、二つの三角形の二辺の長さが等しく、その二辺が作る角度が等しい場合、三角形Aと三角形Bは、「同じ」だと言える。 これらの例でわかることは、あるものとあるものが「同じ」だというためには、それぞれが、同じ種類のものでなければならないということ。数字と三角形は、「同じ」にはなれない。 ここでの「同じ種類」というものを、「同じ型を持つ」ということにすれば、あるものAとあるものBが「同じ」だというためには、AとBは、「同じ型」を持っていなければいけないということになる。 このあたりのことを、数学者のドリーニュが例を挙げて丁寧に説明しているビデオがある。"What do we mean by "equal" " https://goo.gl/nXhqmb 今年の9月にプリンストンの高等研究所で開催された "Vladimir Voevodsky Memorial Conference" https://www.math.ias.edu/vvmc2018 での、彼の講演である。 ドリーニュは、若くして、グロタンディックを出し抜いて「ヴェーユ予想」を解いた有名な数学者なのだが、不思議なことに、彼が説明していることは、コンピュータでプログラミングをしたことがある人は、よくわかっていることだということである。 整数 A=1 と浮動小数点実数 B=1.0 とは、コンピュータ内部での扱いは違うものである。もしも、あるプログラミング言語が、整数型・実数型の他に複素数型をサポートしているとすると、A=1, B=1.0, C=1.0+0.0i は、皆、違うものである。 数字の場合いずれの型にも、加減乗除の演算は定義される。複数の型に適用

意味を考える 4 -- 接触

イメージ
翻訳は、基本的には、外国語を母語に変換する。外国語に接する必要がなかったら、翻訳ツールのお世話になることはない。僕のひいおじいさんやひいおばあさんの世代は、おそらく、翻訳の必要はほとんど感じなかったようにも思う。僕の世代の場合は、おじいさんやおばあさんの世代に「敗戦」と「進駐軍」を体験する。外国語事情は、大きく変わる。 ただ、歴史的には、近年の「グローバル化」が始まる遥か以前から、異なる言語を用いる共同体の接触は、珍しいことではなかったと思う。 世界中は同じ言葉を使って、同じように話していた。  ... 主は降って来て、人の子らが建てた、塔のあるこの町を見て、言われた。「彼らは一つの民で、皆一つの言葉を話しているから、このようなことをし始めたのだ。これでは、彼らが何を企てても、妨げることはできない。 我々は降って行って、直ちに彼らの言葉を混乱させ、互いの言葉が聞き分けられぬようにしてしまおう。」 (創世記11章) なんて意地悪な神だと思うのだが。人間だって「互いの言葉が聞き分けられぬ」ままでいたわけはない。異なる言語が接触した場合、直ちに、翻訳の必要性は生まれたはずだ。 そこで一番大事なことは、言語が異なっても、それが伝えようとすることが「同じ意味」を持ちうることを双方が確信することだと、僕は思う。それは、自明のことのように思えるが、とても大事なことだ。 相手が宇宙人であって同じだと、我々人間は考える。 太陽系外に飛び出すパイオニアにもボイジャーにも、宇宙人に向けたメッセージが積まれていた。それが知性を持つ宇宙人に発見される可能性は、我々が異星人からのメッセージを受け取る可能性と同じくらいに低いのだが。 図1は、パイオニアにつまれたプレート。水素の構造、男女の姿、探査機の外形、銀河系中心と14個のパルサーに対する太陽の相対位置、太陽系が描かれている。 図2は、ボエジャーにつまれたゴールデン・レコード。地球上の様々な音や音楽、55種類の言語による挨拶や様々な科学情報などを紹介する写真、イラストなどが収録されている。「ボエジャーのゴールデンレコード」https://goo.gl/5NZ8Wn これらでは、画像・音・科学的な知識が、「共通言語」として想定されているのは興味ふかい。科学的な知識をメッセージに使うというアイデアは、電波を用いた

第五回マルレク 「人工知能と意味の形式的理論」

イメージ
来年早々になりますが、1月8日に、マルレク第五回を、富士ソフトさんのアキバプラザで開催します。テーマは、「人工知能と意味の形式的理論」です。 告知ページ・募集要項は、近日中に公開します。 募集期間が、年末・年始の時期に重なっているため、いつもより募集時期を若干早めたいと考えています。ご注意ください。 【講演概要】 人工知能研究の大きな課題の一つに、意味の理解をどのように機械上で実現するかという問題があります。 講演では、まず、この分野で、現時点で一定の成功を収めている三つのアプローチを紹介します。 第一は、Amazon Alexa, Google Home 等のボイスアシスタント・システムで多く利用されている、ヒューリスティックなアプローチです。そこでは、チューリング・テストをパスすることを意識した、意味のプラグマティックで「操作主義的」理解が中心にあります。 第二は、Google等の大規模な検索エンジンやDiffbot等が利用している。Knowledge Graph的なアプオーチです。グラフの規模の大小はあるのですが、そこで中心的な役割を果たしているのは、「エンティティ・モデル」です。 第三は、Googleニューラル機械翻訳の成功に刺激を受けた、「機械翻訳技術」の発展と普及を背景としたアプローチです。そこでは、大規模なパラレル・コーパスを大規模なハードウェアを利用して「学習」が行われます。 講演の後半は、現在の実装技術の紹介を目的とした前半と切り口が異なります。「意味の理解」は、「意味」についても「理解」についても、新しい枠組みが必要だというように、丸山は考えています。また、そうした理論は形式的なシステムで記述できるとも考えています。 次のような話をします。 ・文法の構造と意味の構造の対応、あるいは二つの構造の「二重化」の必要について。 ・理論とモデル。数学での意味の扱いに学ぶ。 ・ローヴェールのFunctor Semantics ・新しい「型の理論」

複雑性と重力

イメージ
先に、量子情報理論での「量子テレポーテーション」を、エンタングル状態にある二つのミクロなブラックホールが形成する「ワームホール」をqubitが通り抜ける過程として解釈しようとする理論を紹介した。 今回は、現在進行中の量子論と相対論の統一を目指す動きの中で中心的な役割を果たしているのは、「複雑性」というコンセプトであることを紹介したい。 まず、ここでの「複雑性」の定義から。 サスキンドは、状態|A>と状態|B>との間の相対的な複雑性 C(A, B)を次のように定義する。   C(A, B)= 状態|A>から状態|B>を得る為に必要な最小の量子ゲートの数 すなわち、C(A, B)は、|B> = gggg....|A> となるような最小の量子ゲートgの数である。 この時、C(A, B) =  C(B, A), C(A, B) = 0 iff A=B と、C(A, B) ≦ C(A, D ) + C(D, B ) (三角不等式)が成り立つ。こうして、相対的な複雑性 C(A, C)は、正規化された状態空間の計量(距離)になる。さらに、ある状態の絶対的な複雑性 C(A)を、単純な状態、すなわちエンタングルしていない状態への最小の距離として定義する。 こうして、量子の状態の空間に、この複雑性を計量とした複雑性の幾何学を構成できる。この幾何学上に、一般相対論の基本的命題との対応物を構築していく。「測地線」とか「最小作用の法則」が働く「作用」の量子複雑性幾何学バージョンが存在するのだ。 この対応づけが、驚くような対応関係を明らかにしつつ、面白いように進むのだ。 例えば、この量子複雑性は古典的なエントロピーに対応する。ただし、N個のqubitからなるシステムの複雑性の最大値は、2のN乗になるのだが、古典的な統計力学では、N個の状態からなるエントロピーの最大値はNである。 このことは、N個のqubitからなるシステムの量子複雑性が、2のN乗個の自由度を持ったシステムの古典的エントロピーのように振舞うことを示している。 それらの対応関係は、次の論文「量子複雑性の第二法則」に展開されている。先の紹介は、この論文の第一章を要約したものだ。もちろん、この論文のタイトルは、「熱力学の第二法則」との対応を強調したもの

連続セミナー第三回「人工知能と量子コンピュータ」の様子です

イメージ
今日の角川さんでの連続ナイトセミナー「人工知能を科学する」の第三回「人工知能と量子コンピュータ」の様子です。参加された皆さん、3時間の長い時間、お疲れ様でした。 前回のマルレクすこし飛ばしすぎだったようで今回は少し反省して、「NP-完全」という概念にフォーカスして、全体の流れを伝えることに語り口を変えてみました。どうだったんでしょうね? 今日の資料です。ご利用ください。 https://goo.gl/ymYfFY このシリーズ次回は、12月14日開催の「人工知能と哲学」です。ご期待ください。