Botづくりを始める前に(1)

AmazonのEcho/Alexaの日本上陸を前にして、それを迎え討つべくDoCoMo・Line等の日本勢の動きも、開発者レベルでは慌ただしい。

ただ、これはグローバルな競争の一環だ。すでに、昨年5月に開催されたAmazon Code Conference で、Jeff Bezosは、「ボイス・アシスタントの熱狂的な流行は、すぐ、そこまで来ている。」として、壇上から、 Apple, Google, Amazon製品の「戦争」が迫っているとほのめかした。http://goo.gl/rR5BqP

 「ボイス・アシスタント」技術の周辺にみられる二つの期待を確認しておこう。

第一に、機械と人間のインターフェースが、人間と人間の通常のインターフェースと同じように、音声中心のものになっていくという期待がある。
第二に、そうしたインターフェースの変化は、機械が賢くなるということなのだが、それは、ディープ・ラーニングを中心とする人工知能技術によって可能になるという期待がある。

ただ、ディープ・ラーニング技術に限って言えば、現在のディープ・ラーニング技術が、ボイス・アシスタントの分野で確実に達成できることは、音声を文字列に変換するところまでである。変換された文字列をどう処理すべきかは、現在のディープ・ラーニング技術は、何も教えてくれないと考えたほうがいいのだ。

そのことは、現在のディープ・ラーニング技術の最先端である、Google Deep MindのDifferentiable Neural Computerや、FacebookのMemory Networkが、bAbiデータセットと悪戦苦闘していることを見ればよくわかる。小学4年生程度の国語の問題をうまくハンドルすることが、現実的には、最先端の課題なのだ。

逆に、彼らの研究を突き動かしている最大の力は、ビジネス的には、ボイス・アシスタントを巡る競争での優位の確保である。

それにもかかわらず、ある種の幻想に突き動かされて「戦争」は、始まるだろう。多くのエンジニアが、それに巻き込まれるだろう。

楽観的には、こうして流される「血と汗」の上に、新しい技術が生まれると考えることもできなくはないのだが、こうした「理性の狡知」流の楽観論は、現実的には悲観論者の諦觀でしかない。

どうせ、「血と汗」を流すなら、できるだけ、筋のいい方向で頑張ったほうがいいと思う。次のポストで、Botづくりを始める前に、押さえておくべき基本を確認しようと思う。

コメント

このブログの人気の投稿

TensorFlow Foldについて

TPU論文の翻訳(1)

可微分ニューラルコンピュータとは何か(1) 概論