ボイスAIはAI利用拡大のゲームチェンジャー 2

【 ボイスAIはAI利用拡大のゲームチェンジャー 2 】

"ChatGPT can now see, hear, and speak"

「ChatGPTでは、新しい音声と画像機能を提供し始めています。音声で会話したり、話している内容をChatGPTに見せることで、より直感的な新しいタイプのインターフェイスを提供します。」

それでは、なぜ、僕は "hear and speak" するAI に注目しているのでしょうか? 

前回も述べたように、ChatGPTの入出力を音声にするのは、技術的には簡単なことです。ただ、ChatGPTのChat は、「おしゃべり」や会話ではなく、テキストの交換です。それは、インターネットとスマホが普及するまでは、耳と発話が不自由な人のコミュニケーションのスタイルでした。

そうしたコミュニケーションのインターフェースを、近未来のAIが引き継ぐかは、よく考える必要があると思います。

人間の言語能力は、約10万年前(その時期は特定されているわけではありません)、話す・聞く能力として開花し、そのスタイルが人間という生物種に固有な能力として維持されてきました。

それに対して、文字の利用は、長くとも数千年の歴史しかありません。正確にいうと世界の大多数の人が文字を使えるようになったのは、近現代になって、いわゆる「民族国家」「市民社会」が成立し、具体的には、学校制度が定着してからです。短く見積もれば、この100~200年の間に起きた変化です。

人間が、全体としては、言語生活の歴史の大部分を文字なしで過ごしてきたということ、また、文字の利用は、人間の生物学的な「ネイティブ」な能力ではないということは、人間のコミュニケーションの志向に深いところで影響を与えていると思います。

ネット上のコミュニケーションのスタイルは、ChatGPTを含めて、話す・聞くに対して、書く・読むが優位になったと考えることもできます。他方では、ネット上のコミュニケーションの拡大は、むしろ多くの人の「文字離れ」を起こしていると考えることもできます。

後者の「文字離れ」の志向が強まるという現象は、人間の言語活動の成り立ちと歴史から見ると、むしろ自然なことかもしれません。

ただ、文字の利用については、留意すべき重要なことがあります。それは、文字の利用には二つの顔があるということです。

一つは、隣のデスクの人とchat で会話する、Lineで近い友人と話をするといったような、ほぼリアルタイムのコミュニケーション手段としての使い方です。これを文字の「共時的」な使い方としましょう。

もう一つは、本を読むとか、ネットで検索をするとかWikipedia を調べるといったような場合の、眼前にはない「情報」の担い手として文字を利用する使い方です。これを「通時的」な文字利用としましょう。

文字は、基本的には、個人の記憶力に依存せず、現在の情報を残そうという欲求から生まれたものです。「古代文明」は、大抵の場合、文字を生み出しています。それは、世代を超えた情報伝達を可能にしました。「通時的」というのは、そのことを指しています。そのことは、文字は、情報の「保存装置」としての役割を持つことを意味しています。

我々にとって、文字の一番重要な役割は、この第二の側面にあると僕は考えています。それは、一部で「文字離れ」が進んでいても、文字の媒体が紙から電子的なものに変わっても、それは変わりません。

表題の「ボイスAI」の話に戻ります。

もしも、みんながドラえもんのようなロボットと一緒に暮らしていて、彼は、僕らの質問に、可能な限りいい答えを返してくれるとしましょう。

彼とのやりとりに、僕らは、キーボードを叩く必要があるでしょうか。それは面倒です。ボイスでやり取りをするのが「自然」です。

彼の話は、聞き取りやすいものになるでしょうか? それは場合によります。

ある場合には、ボイス・インターフェースを他のテキストあるいはイメージのインターフェースに切り替える必要があるでしょう。

また、ある場合には、AIロボットとのボイスによるやり取りを繰り返して、必要な情報をボイスで取得することに成功するかもしれません。

実は、大規模言語モデルにとって、こうした 人間・機械間のやりとりを繰り返すfew-shot prompt は、正しい答えに辿り着く、とても有効な方法なのです。もっとも、現在のAIは、「次のプロンプト」をサジェストすることはできていません。それは、もっぱら、人間の役割です。ただ、この点は、少しマシにできるかもしれません。

僕の「ボイスAI」に対する期待は、このような新しいインターフェースの開発への期待です。同時にそれは、そうしたインターフェースを搭載した新しいデバイスの登場への期待です。

そうしたとき、「ボイスAIはAI利用拡大のゲームチェンジャー」になると考えています。 

---------------------------------

ショートムービー「 ボイスAIはAI利用拡大のゲームチェンジャー 」を公開しました。
https://youtu.be/nXVdN7viB5A?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU

ショートムービー 「 ボイスAIはAI利用拡大のゲームチェンジャー 」のpdf資料
https://drive.google.com/file/d/1851SEDz3JKL4c0vxeFVu6pGynMpvxyAi/view?usp=sharing

blog : 「 ボイスAIはAI利用拡大のゲームチェンジャー 」
https://maruyama097.blogspot.com/2023/10/aiai.html

blog : 「 ボイスAIはAI利用拡大のゲームチェンジャー  2」

セミナーに向けたショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU

マルレク「AIの利用とインターフェースを考える」のまとめページ
https://www.marulabo.net/docs/personalai/

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について