投稿

ラベル(Language)が付いた投稿を表示しています

マルレク・ネット動画配信のお知らせ

イメージ
5月22日開催のマルレク2018 第一回「ポスト・ディープラーニングの人工知能技術を展望する」を収録した動画のネット配信が始まりました。オープニングの部分は、無料で視聴できます。ご利用ください。 https://crash.academy/class/278 講演資料は、こちらからダウンロードできます。 https://goo.gl/jU54FM ------------------------------------ これまでのマルレク・ネット動画公開の情報です。 ------------------------------------ 2018/05/22 「ポスト・ディープラーニングの人工知能技術を展望する」 動画: https://crash.academy/class/278 資料: https://goo.gl/jU54FM 2018/1/15「ボイス・アシスタントから見るAIの未来」 動画: https://crash.academy/class/203 資料: https://goo.gl/i1V7Et 2017/11/30「量子コンピュータとは何か? 」 動画: https://crash.academy/class/189 資料: https://goo.gl/muA5TU 2017/9/28 「エントロピーと情報理論 -- 量子情報理論入門」 動画: https://crash.academy/class/156 資料: https://goo.gl/cu8F2r 2017/7/31 「人工知能の歴史を振り返る 」 動画: https://crash.academy/class/139/ 資料: https://goo.gl/6MeZJh 2017/5/28 「ニューラル・コンピュータとは何か? 」 動画: https://crash.academy/class/101/ 資料: https://goo.gl/qZyLQD 2017/3/27「Googleニューラル機械翻訳 」 動画: https://crash.academy/class/76/ 資料: https://goo.gl/X72wnM 2017/2/22「RNN と LSTMの基礎」 動画: http

言語とAI

イメージ
今日は、赤門前の喫茶店で、「日本語学会」の先生と「人工知能学会」の先生と三人でお茶を飲む。 言語に興味を持つ人と人工知能に興味を持つ人、いろいろ交流できればと思う。

ランベックとカテゴリー文法 2

カテゴリー文法には、"categorial grammar" と "categorical grammar" の二つの表記がある。前者の方が多いのだが。なぜだろうと思っていたのだが、ランベックの"From Word to Sentence"を読んで理由がわかった。 ランベックが学会に提出した論文に対して、査読者からこんな指摘があったらしい。 「君のタイピストは、categorial じゃなく "categorical"と書いてるぞ」 先の本でランベックが言うには、それはタイピストのせいじゃなく自分がそう書いたからだからと言う。正直である。 このエピソードが紹介されている、"26. Remarks on the history of categorial grammar." (ちゃんと"categorial" になっている)は、彼の理論の数学的背景が、簡潔にまとめられている。かつての僕の数学的関心と重なっていて、とても面白かった。 ただ、彼の理論は、当時の言語学ではあまり評価されなかったようだ。チョムスキーとロバート・リースの二人だけが、研究を続けるように、彼を励ましたという。チョムスキーとランベックは、僚友だったのだ。 チョムスキーの生成変形文法が、一世を風靡するのをみたランベックは、他に関心をうつす。「言語学は、君に任せた。僕は数学をやる。」というような感じだったと思う。 それではなぜ、ランベックは、言語学にもどってきたのだろうか?その答えは、この本の一番最後の章 "36. Postscript on Minimalism." にある。 彼は、チョムスキーの最近(といっても、随分経つが)の 「ミニマリスト・プログラム」に、触発されたのだと思う。 「チョムスキー商会」を、スフィンクスの鼻が欠ければ、そのレプリカをお土産として売ろうとするフレンチ・コミックを紹介してそれにたとえたり、「minimalist program(誰かは、maximalistと呼んでいるよ)」「government theory, binding theory, case theory, X-bar theory, phrase str

ランベックとカテゴリー文法

イメージ
ランベックは数学者で、60年近く昔の1950年代に言語学で重要な働きをする。ちょうどチョムスキーが活発に活動を始めた時期だ。彼は「ランベック計算(Lambek calculus)」という手法を導入して、「カテゴリー文法」という分野を作り出した。 ただ、ランベック自身は、その後長いこと言語学から離れていたのだが、晩年(彼は、2014年に死去する)に、また言語学に関心を寄せる。2008年の "From word to sentence: a computational algebraic approach to grammar"  https://goo.gl/b2DbFD  は、その時期の代表的な著作だ。 カテゴリー文法というと、先日紹介した「応用カテゴリー理論 ACT」のように、文法理論に数学のカテゴリー理論を適用したものと思うかもしれないが、実は、違うのだ。(もっとも、現在では、数学のカテゴリー理論の側からの、カテゴリー文法へのアプローチは、活発に行われている。それについては、後日に、紹介する。) カテゴリー文法でいう「カテゴリー」というのは、古い文法でいう「品詞」という分類を、さらには、最初期のチョムスキーの句構造解析での諸範疇を、文は語から構成されるという観点から、拡大したものだ。 例えば、「文(S)は、名詞句(NP)と、それに続く動詞句(VP)から成る。」とか「名詞句は、限定詞(Det)と、それに続く名詞(N)から成る。」という文法規則で、S, NP, VP, Det, N は、カテゴリーである。 ただ、それだけだと、句構造文法と変わらない。カテゴリー文法のカテゴリーは、もっと豊かである。簡単な例をあげよう。(これも、ランベックの初期のスタイルの簡単な例なのだが) "the boy made that mess." という文に出てくる一つ一つの語に、次のようなカテゴリー(「型」と言っていい)を割り当てる。   the --> NP/N   boy --> N/N   made --> (NP\S)/NP   that --> NP/N   mess --> N Nは名詞、NPは名詞句、Sは文 だと思えばいい。 ここでは、"the",

Post Deep Learning 3時間話したのだが、終わらず

イメージ
昨日の「Post Deep Learningの人工知能技術を展望する」の様子です。 言語学での、"merge"の話をしています。下記のAgendaのPart III 「言語能力への言語学的アプローチ」までは、話せたのですが、Part IV 「数学的認識能力への数学的アプローチ」に入れませんでした。残念。 スライドはぶっ飛ばして、3時間話したのですが、時間の想定に無理があったんでしょうね。4時間枠の方がよかったのかも。 途中で、5分休憩して、タバコ吸ったのが敗因かも。数学の話聞きたかった人、ごめんなさい。   -------- Agenda -------- 「ポスト・ディープラーニングの人工知能技術を展望する」  Part I  人工知能の歴史を振り返る  Part II  人間の知能と機械と人間の歴史を振り返る  Part III  言語能力への言語学的アプローチ  Part IV  数学的認識能力への数学的アプローチ

セミナー予告【 1/31 「ポスト・ディープラーニングの人工知能技術を展望する」 】

イメージ
1/31 上記のセミナーを角川アスキー総研さんで開催します。 https://lab-kadokawa43.peatix.com/ 現在の「人工知能」技術の中核は、ディープ・ラーニング技術です。ディープ・ラーニング技術は、2012年以来、爆発的に発展・普及し、大きな成果を上げてきました。 しかし、現時点でのディープ・ラーニング技術の達成は、人間の「知能」の機械による代替に成功したというよりは、人間と動物に共通する「感覚=運動能力」の機械による代替に、大きな可能性を開いたということに他なりません。 それには理由があると、僕は考えています。 ディープラーニングがよって立つ立場は、人間の(それは、脳を持つ他の動物とも同じなのですが)認知・運動能力は、基本的には脳のニューロンの結合状態に還元できるというものです。この「コネクショニズム」という還元主義は、強力なものですが、動物と人間の違いを考えようとすると、あまり役には立ちません。 人間固有の認知能力と言えば、言語的認識能力と数学的認識能力が双璧です。セミナーでは、この二つの能力に、ディープ・ラーニング以外の陣営から、どのようなアプローチが行われているか紹介したいと思います。 セミナーでは、人工知能研究の歴史を振り返りながら、知能へのもう一方のアプローチ、「計算主義」(僕は、あまり、この名前気に入ってはいないのですが。といって、「シンボル主義」というのもどうかなという気がしています。)を取り上げられればと思っています。 僕の基本的立場は、人工知能に関しては、「コネクショニズム」も「計算主義」も、人間の「知能・認知能力」の全領域をカバーするには、いささか足りないところがあるのではというものです。ただ、個人的には、いわば哲学的には、数学的認識のメカニズムに強い関心を持っています。 セミナーでは、現代の生物学的かつ計算主義的言語学の潮流を、ChomskyのMinimalist Programを中心に紹介しようと思います。 現代の知能への「計算主義」的アプローチの始祖は、いうまでもなくTuringです。セミナーでは、こうした系譜を受けつぎ、コンピュータによる数学の証明に取り組み、昨年、急逝したVoevodskyの仕事を紹介できればと思います。

1/15 マルレク講演資料公開

イメージ
明日のマルレクの講演資料です。ご利用ください。 https://goo.gl/i1V7Et   本論は、Part III です。こちらだけでもどうぞ。

1/15 マルレク リマインダ

イメージ
1/15マルレク「ボイス・アシスタントから見るAIの未来」一般の受付、1/9 12:00から開始します。 https://peatix.com/event/333453   【講演概要】 2018年は、コンシューマの世界で、Amazon Echo, Google Home 等の「ボイス・アシスタント」の本格的でグローバルな普及が始まった年として、歴史に残る年になると思います。 丸山は、コンシューマ向けの初めてのAIアプライアンスとしてのボイス・アシスタントの普及は、AIの未来を展望する上で、とても重要なステップになるだろうと考えています。 そのことは、現在のボイス・アシスタント技術が完成したAI技術であることを、少しも意味しません。現状は、むしろ、その逆です。ただ、コンシューマ市場での激しい競争が、現在の技術のいくつかの問題の解決に向けた進化の、大きな淘汰圧として作用するだろうことを期待しています。 講演では、前半で、Amazon Echo, Google Homeの特徴を、そのAPIを通じて概観します。 後半では、ポスト・ディープラーニングのAI技術の主要な課題である、「知識表現とその利用」「言語の意味理解」の二つにフォーカスして、現状と課題を考えます。 AI技術は、2012年から始まったディープ・ラーニング中心の時期を超えて、新しい発展段階に突入しようとしています。この変化の中心的な担い手が、ボイス・アシスタントです。ボイス・アシスタント技術は、AIが向かう未来のパーソナル・アシスタンス・システムの先駆として、これからも、AI技術の中核として発展していくと考えています。

意味の形式的理論 -- Entityモデル

「二つのものの関係の中に意味が現れる」と先に書いたのだが、少し、先回りしすぎたかもしれない。小論は、こうした方向と関係の基本である「同一性」概念にそって「意味の形式的理論」を考えることを目標にしているのだが、その前に、触れておかなければならないことが、いくつかあることに気づく。 一つは、「形式的理論」の「形式」を与える認識の数学的モデルの妥当性についてである。これについては、いろいろ語るべきことが残されている。それについては、いずれ、ゆっくり説明していこうと思う。(「名付け」と「参照」のfibrationモデルは、「意味不明」だったかも。) もう一つは、先の問題に比べると極めて具体的な問題なのだが、「意味の形式的理論」の一種である「知識の表現理論」について語ることである。これについては、簡単なオーバービューを与えることができるとおもう。(「意味」と「知識」とは、正確に言えば、異なるものである。) コンピュータ上での実装を見る限りでは、検索でもボイス・アシスタント技術でも、現代の「知識の表現理論」の主流は、次のような「Entityモデル」である。 「パンダ」はEntityである。Entityは型(Type)を持つ。「パンダ Entity」は「パンダ Type」を持つ。別の言い方をすれば、「パンダ(Entity)は、パンダ(Type)である。」ということになる。 Entityモデルでは、それぞれのEntityは、Propertyを持つ。パンダのEntityはパンダのPropertyを持つ。「笹が好き」「指が6本ある」「パンダ色をしている」とかが、パンダ entityのパンダPropertyになる。 だから、Entityモデルでは、パンダについての知識は、基本的には、パンダEntityのパンダPropertyで表現されることになる。 Entityモデルには、「Entityは型を持つ」「EntityはPropertyを持つ」の他に、もう一つの重要な特徴がある。それは、Entityの型が、概念の包含関係を反映した階層構造を持つということである。パンダは哺乳類である。哺乳類は動物である。動物は生物である。(かなり、いい加減な「階層」だが)    パンダ < 哺乳類 < 動物 < 生物 このEntityの型の階層が「知識の表現」で意味を持つ

意味の形式的理論 -- 文の意味

外国語の翻訳をする時、個々の語の意味は分かるのだが -- 辞書を引けばそれは分かる -- 文の意味が取れないことがよくある。そうした意味では、シンボルや記号の意味論は、プリミティブで重要なものだが、文の意味は、それらに還元されるわけではない。 シンボルの素朴な意味論に、思考の中のシンボルとそれが指示する実在のものの対応関係が登場する様に、文の素朴な意味論には、文とそれが指示する現実との対応関係が現れる。  「太陽が東から昇る」  「一つの林檎ともう一つの蜜柑で、果物は二つ。」 文が、ある範囲では正確に、現実を反映しうるということは、とても大事な言語の性質である。このことを否定する必要はない。 ただ、文の意味の素朴な実在との対応理論は、シンボルの対応理論より、やや、つまらない。文は、必ずしも現実の関係を反映したものとは限らないからだ。現実にはないことを、我々は、文で表現できる。  「僕は、巨大な虫に変身した。」  「地球には、もはや生命は存在しない。」 (我々は、意味の表象は難しいが、"Colorles green sleeps furiously" のような「正しい文」を生み出すこともできる。) 人間以外の生物の認識能力は、基本的には、環境の中でよりよく生存するために必要なものに限られている。言語能力が我々にもたらした認識の最大の飛躍は、むしろ、そうした現実の認識という束縛から我々を解放したことにあるとさえ言っていい。 先に、言語能力の獲得と宗教の発生は、同じ時期に遡ると書いたが、芸術の起源も同じ時期に遡る。「ものがたり」は、「もの」を「かたる」ことから始まるのだが、いつか「もの」の世界は拡大し、実在する「もの」の背後にあるものを、人は語り始める。 現実は、見かけの現象のとおりではない。その背後には共通の実体があり、さらにはより深い本質がある。言語能力による認識能力は、一つのものを、一つのものではない、もっと複雑なものに分裂させる。それは、現代の「科学」の母胎でもある。 別の例で、文の意味について考えてみよう。 ある英語の文について、「その意味は?」と日本人に問われたら、その英文を日本語に訳すのは不自然なことではない。ただ、日本語の文について、「その意味は?」と日本人に問われたら、意味を問われた人は

1/15 マルレク リマインダ

イメージ
お休み中、失礼します。 1/15マルレク「ボイス・アシスタントから見るAIの未来」個人協賛会員の受付、本日(1/2 12:00から)開始しています。 https://peatix.com/event/333453 今回、会場があまり広くないので、満席が予想されます。お申し込み、よろしくお願いします。     【講演概要】 2018年は、コンシューマの世界で、Amazon Echo, Google Home 等の「ボイス・アシスタント」の本格的でグローバルな普及が始まった年として、歴史に残る年になると思います。 丸山は、コンシューマ向けの初めてのAIアプライアンスとしてのボイス・アシスタントの普及は、AIの未来を展望する上で、とても重要なステップになるだろうと考えています。 そのことは、現在のボイス・アシスタント技術が完成したAI技術であることを、少しも意味しません。現状は、むしろ、その逆です。ただ、コンシューマ市場での激しい競争が、現在の技術のいくつかの問題の解決に向けた進化の、大きな淘汰圧として作用するだろうことを期待しています。 講演では、前半で、Amazon Echo, Google Homeの特徴を、そのAPIを通じて概観します。 後半では、ポスト・ディープラーニングのAI技術の主要な課題である、「知識表現とその利用」「言語の意味理解」の二つにフォーカスして、現状と課題を考えます。 AI技術は、2012年から始まったディープ・ラーニング中心の時期を超えて、新しい発展段階に突入しようとしています。この変化の中心的な担い手が、ボイス・アシスタントです。ボイス・アシスタント技術は、AIが向かう未来のパーソナル・アシスタンス・システムの先駆として、これからも、AI技術の中核として発展していくと考えています。

意味の形式的理論 -- Fibration

イメージ
ところで、先のポストで見た二つの図式と同じような構造を持つ数学的対象が存在するのだ。 次の図を見て欲しい。二つの集合EとBとが、二つの関数 pとs とで結ばれている。 集合Eの各点は、集合B上の一点xと、pで結ばれている。この時、pをB上のFibrationという。逆に、関数sが、xをE上の点 s(x)に写す時、sをpのsection(切片と思えばいい)と呼ぶ。

意味の形式的理論 -- 素朴な対応理論2

イメージ
空海は、言葉と実在の間には、本源的なつながりが、そもそも備わっていると考える。「ア・ウンの呼吸」の「阿(ア)吽(ウン)」は、梵語のアルファベットの最初と最後の文字だが、それは、そのまま、全てのものの「本初」と「究極」の象徴となる。 「真言」の「マントラ」を唱えることで、宇宙の法則と同一化し、その力を自分のものにできる。壮大なストーリーだが、ある種の「言霊信仰」と言っていい。ただ、そう斬って捨てるには、宗教とそれを伝える言葉との関係は、現在でも複雑なものだ。 言葉と実在を、いったんは切り離し、人間の言語能力がそれを結びつけるという言語観は、人間の歴史から見ると、比較的新しいものだ。明らかなことは、宗教の起源と人間の言語能力の獲得は同時に起きただろうということ。 話を戻そう。 先に、言葉とものとを、「名付け」と「参照」という二重の仕方で結びつけた。ただ、こうした二項を密に結びつける素朴で単純な図式では、表現されないものが存在する。 一つは、言葉とものとの関係の「恣意性」であり、もう一つは、具体的には異なる複数のものが、「同一」の名前を持つことである。 ただ、この二つを、新しい図式で表現することは出来る。 図1は、様々な言語で、同じものが異なる名前を持つことを表現し、図2は、具体的には異なるものが、同一の名前を持つことを表現している。 いずれでも、緑の矢印は「名付け」を、青の矢印は「参照」を表している。 奇妙なことだが、両者は、同じ構造を持つ、双対な図式で表現される。今度は、その形式化を考えよう。

意味の形式的理論 -- 素朴な対応理論1

イメージ
オグデンとリチャードの「意味の三角形」の要点の一つは、三角形の底辺部分が欠けていることなのだが、これは、一つには「シンボル」とシンボルが表現する「被参照物」が、直接の関係を持たないことを表している。それは、ソシュールがいう「記号の恣意性」というのと、同じことである。 底辺の欠落には、もう一つの理由がある。底辺の左側の「シンボル」は思考の内側にのみ存在し、底辺の右側の「被参照物」は基本的には思考の外側のみに存在する。底辺の二項は、存在のあり方が異なっている。(ここでは、思考の内部の「被参照物」を直接には考察の対象とはしない。その意味では、素朴な対応理論である。) 底辺の二項を結びつけているのは、人間の言語能力・思考の作用である。こうした能力の存在を仮定すれば、底辺の二項はつながりを持つ。 この三角形の辺を動かして、一直線上に並べてみれば、「シンボル」とそれが表現する「被参照物」とは、二つの仕方で結びついていることがわかる。 一つは、思考の内側のシンボルが、思考の外部に存在するあるものを参照するという関係(図1右上の青い矢印)であり、もう一つは、思考の外部のあるものを思考の内部にシンボルとして取り込む(図1右下の緑の矢印)ことである。後者の、もっともプリミティブな言語化の例は、ものに名前を与えることである。(シンボル=名前=語) 図2は、我々の思考の内側の「語の世界」と、我々の思考の外部の「現実の世界」が、「名付け」と「参照」という逆方向の対応で結びつく様子を示している。

意味の形式的理論 -- 空海の言語論 「声字実相義」

イメージ
「声字実相義」は、今からちょうど1,200年前の819年頃に書かれた、空海による、「声」と「字」と「実相」の関係を論じた、言語論である。 「内外の風気わづかに発すれば必ず響くを名づけて声という。響きは必ず声による。声はすなわち響の本なり。声発して虚からず、必ず物の名を表するを号して字という。名は必ず体を招く。これを実相と名づく。」 それは、「口から出ることば(声)」と「物の名(字)」と「実体(実相)」の関係を論じたものだ。 こうした要約は、不正確かも知れない。空海は、「真言宗」の祖である。「真言」とは文字通り「正しい言語」のことで、彼の宗教の根幹には、言葉の力に対する深い確信がある。 この書を、「言語論」とくくるのも、どうかなと思う。それは生命論でもあり、人間論でもあり、環境論でもあり、宇宙論でもある。言語を中心に置いた、壮大な自然哲学でもある。 次の北尾克三郎氏の「現代語訳」が、ネットで利用できる。 https://goo.gl/VXViKL 空海の言語論-『声字実相義』<現代語訳> 目 次 Ⅰ 理念<いのちと自然の声を聞くための「言語」> Ⅱ 基礎理論<言語の構造>   (イ)論題:「声」と「字」と「実相」との関係性とは   (ロ)論題の梵語<複合語解釈法>による論証   (ハ)言語論の典拠 Ⅲ 本論<物質といのちの"はたらき"と"すがた"を分析する言語>   (イ)言語の定義   (ロ)定義の展開   第一の定義<物質のひびきとしての言語>   第二の定義<住む世界と呼応する言語>   第三の定義<形象を区別・編集する言語>   (A)形象の定義   (B)定義の展開   1「物質と現象」のすがた   2「いのちとその環境」のすがた   3「共生の事象」のすがた   4「心象」の本質 もちろん、空海の言語論が、現代にもそのまま妥当するわけではないのは明らかだ。ただ、1,200年前、こうした広い視野を持つ天才が日本に生まれたことは、特筆に値するとおもう。 北尾氏の訳は、いわゆる「超訳」に近いものだとおもう。ただ、空海の思想を現代的に捉え返そうとい

意味の形式的理論 -- 意味の意味

イメージ
久しぶりに縦書きの本を読む。東京のアパートには、ほとんど本はないのだが、稚内には、少し本がある。 オグデンとリチャードの「意味の意味」は、1923年発行。1920年から22年にかけて書き溜められた論文がベースだというから、ほぼ100年前の本だと思っていい。 「意味の三角形」が有名。左が邦訳、右が原著。 基本的には、左下のSymbol(「象徴」)と右下のReferent(「指示物」)を、Thought or Reference(「思想あるいは指示」)が結びつけるという図式。 翻訳、少し不満がある。 Symbolは「象徴」ではなく「シンボル」のママがいいと思う。Referentは「指示物」だと、指示するものなのか指示されるものなのかわかりにくいので、「被指示物」とか「参照対象」の方がわかりやすい。Thoughtは、「思想」よりむしろ「思考」、Referenceは「指示」よりは「指示作用」とかの方がいいと思う。 抽象的な概念を表す言葉と事実との対応付けの難しさを論じた引用部分の「religion(宗教)、patriotism(愛国心)、property(性質)」(邦訳48ページ)の「property(性質)」は、「property(所有)」の誤訳だろう。 原文は、ここで読むことができた。 https://goo.gl/fEomsu 枠組みは100年前のものだが、著者らの「意味」に関係する文献についての博覧強記ぶりは印象的である。シンボルとその参照対象を結びつけるのは、人間の「認識能力」だという理解は、現代的な言語理論とも、大きな意味では繋がっている。 彼らが取り上げているトピックスに、いろいろインスパイアーされて、とても面白い。(もっとも、僕の関心は、意味の理論の形式的表現にあるので、先の図式のCorrect やAdequateを、Faithfull で Full なFunctor と読み替えるのだが。それについては後述。 ) 邦訳は、大昔に読んだはずなのだが、内容はともかく、イギリスの知的エリート特有の高慢で皮肉たっぷりの文体の記憶がほとんどない。僕が鈍感だったのか、当時、僕のまわりには、そういう文体があふれていたのか。多分、後者のような気がする。

1/15マルレク「ボイス・アシスタントから見るAIの未来」

イメージ
告知ページ: https://peatix.com/event/333453/ 講演概要: 2018年は、コンシューマの世界で、Amazon Echo, Google Home 等の「ボイス・アシスタント」の本格的でグローバルな普及が始まった年として、歴史に残る年になると思います。 丸山は、コンシューマ向けの初めてのAIアプライアンスとしてのボイス・アシスタントの普及は、AIの未来を展望する上で、とても重要なステップになるだろうと考えています。 そのことは、現在のボイス・アシスタント技術が完成したAI技術であることを、少しも意味しません。現状は、むしろ、その逆です。 ただ、コンシューマ市場での激しい競争が、現在の技術のいくつかの問題の解決に向けた進化の、大きな淘汰圧として作用するだろうことを期待しています。 講演では、前半で、Amazon Echo, Google Homeの特徴を、そのAPIを通じて概観します。 後半では、ポスト・ディープラーニングのAI技術の主要な課題である、「知識表現とその利用」「言語の意味理解」の二つにフォーカスして、現状と課題を考えます。 AI技術は、2012年から始まったディープ・ラーニング中心の時期を超えて、新しい発展段階に突入しようとしています。この変化の中心的な担い手が、ボイス・アシスタントです。ボイス・アシスタント技術は、AIが向かう未来のパーソナル・アシスタンス・システムの先駆として、これからも、AI技術の中核として発展していくと考えています。   ------------------------ 1/15 マルレク開催概要 ------------------------ 日時:2018年1月15日 19:00-21:00 場所:日本マイクロソフト本社(品川) テーマ:「ボイス・アシスタントから見るAIの未来」 年末・年始の休日をはさんでおりますので、申し込みの期間設定、いつもと異なります。後日、詳細をお伝えします。

11/14 ボイス・アシスタント・セミナー

イメージ
11月14日、角川さんで、AlexaやGoogle Homeといったボイス・アシスタントについてのセミナーを行います。 好評をいただいた9/12のセミナー(写真)の再演です。10/14にAndroid の会で行った基調講演の3時間バージョンです。 お申し込みは、こちらから。お申し込みお待ちしています。 http://lab-kadokawa35.peatix.com

Alexa Intent Signature

イメージ
ちょうど一年前のマルレクで「パーソナル・アシスタント・システム」を取り上げ、当時のMS Cortana, Amazon Alexa, IBM Watson Dialogについては、結構、詳しく調べた。 今度、角川の  遠藤 さんからリクエストがあって、ボイス・アシスタントの話をするので、いろいろ調べ直しているのだが、この一年の間に、Alexaのフレームが「進化」しているのがわかって面白い。 一年前のAlexaは、基本はVoiceCommandで、Speech2Textを直接呼ぶ必要はないものの、多数の発話のサンプルを一つのIntentに束ねるという素朴なIntent Modelだった。それはそれでいいのだが、例えば「日付」の発話を理解させるためにSample Utteranceに、DateIntentとして"January First"から"December Thirty-First"まで365日全てが記述されていて、こりゃ大変だと驚きあきれた。 Alexaの次の「進化」は、Intentの引数としてSlotを導入したことだ。Slotは、引数であると同時に型を持つ「変数」でもある。もしその型が事前に定義されたものなら、そのUtteranceを全て書く必要はない。先の例だと 、Utteranceのサンプルの文字列に{AMAZON.Date}を埋め込めばいい。Alexaの開発環境である"Alexa Skill Kit"は、こうした世界。これぐらいは、僕も知っていた。 こうした、Intent / Entity Modelは、現在のボイス・アシスタント技術で広く共有されている。(ただ、Google Assistant は、会話がカスタマイズ可能か微妙なので、ちょっと違いそうだ。それについては、別の機会に。) ただ、僕が感心したのは、Alexaの新しい開発環境である "Alexa Skill Builder (beta)" で導入された Intent Signature Syntaxである。"Understanding the Structure of the Built-in Intent Library"  https://goo.gl/ebKVxg

Googleの逆襲

イメージ
9月1日から一般公開が始まった、ベルリンで行われているIFA(国際コンシューマー・エレクトロニクス展)で、ボイス・インターフェース系が熱いようだ。 1月のCESでは、echo / Alexa が隠れた主役と言っていい大人気だったのだが、9月のIFAでは、Googleが大逆襲。多くのメーカーが、Google Assistant 搭載の「Smart Speaker」を出品したようだ。 SONYやPanasonicも、Google陣営に。あと、スピーカーのJBLや、バッテリーのAnkerも、Google Assistant だって。 https://goo.gl/mwzexD やっぱり、ジェフ・ベソスが予告してたように、「戦争」が、始まるんだね。 http://goo.gl/rR5BqP 戦争は嫌いだけど、あっちの戦争より、こっちの戦争の方が、マシかも。