ボイスAIはAI利用拡大のゲームチェンジャー 3
【 メディアのマルチモーダル化について 】
マルチモーダルなAIへのAI技術の展開は、新しいインターフェースの開発とそうしたインターフェースを搭載した新しいデバイスの登場を準備します。それがAIをめぐる開発競争の、次の段階での重要な舞台になると僕は考えています。
ただ、それを「インターフェース」の問題としてだけで考えるのは、近未来の予測としては狭いのだと感じています。
「感じる」というのは、曖昧に思われるかもしれません。それは僕が技術的な「予測」というより、これまでなかった何か新しいものが生まれるかもしれないという「予感」レベルの話をしているからかもしれません。
ただ、そうした「予感」には、根拠がないわけではありません。(「予感」は、まだ見ぬ未来を考える上では重要なものだと、僕は考えています。)
少なくとも、近現代の電気・電子的なメディアは、その長くはない歴史の中でも、マルチモーダル化のいくつかの波を経験しています。
電信から電話へ:これは「信号」(これはテキストの亜種と考えられます)から「音声」へのマルチモーダル化です。信号から音声へという同じモーダルの変化が、次の例でも現れます。電話はリアルタイムで「双方向性」を持つという点では画期的なメディアだと思います。
無線通信からラジオへ:ここでは、信号から音声へというモーダルの変化とともに、「1対1」から「1対多」というモードの変化が重要です。ただし、ラジオには「双方向性」はありません。
ラジオからテレビに:テレビは、基本的にはラジオの特性(「音声」「一対多」「一方向」)を引き継いだまま、それに「イメージ」を追加したマルチモーダル化です。
とても雑なまとめですが(インターネットの話がぬけていますね)、ここで僕が強調したかったことは、メディアのマルチモーダル化は、その利便性によって多くの利用者を獲得し、それまで存在しなかった新しい強力な産業を創出する、とても強い力を持っていたということです。
メディアのマルチモーダル化は、決して同じ産業構造上の同一のデバイス上での「インターフェース」の進化ではありませんでした。それは、新しいデバイス(電話・ラジオ・テレビ等)を産み出し、新しい産業を台頭させ、産業構造を変えました。
21世紀初頭に起きたIT産業の再編は、インターネットという新しいメディアの上での、クラウドとクラウド・デバイスであるスマートフォンの利用者の拡大によって引き起こされました。その勝者であるGAFAMの時代は、この四半世紀続いています。
スマートフォンという「賢い電話」は、もっと賢くなると思います。そうした進化は、新しい産業を育てていくと思います。その突破口は、AIのマルチモーダル化によって引き起こされると、僕は考えています。
---------------------------------
ショートムービー「 メディアのマルチモーダル化について 」を公開しました。
https://youtu.be/B4y76rmyq1M?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU
ショートムービー 「 メディアのマルチモーダル化について 」のpdf資料
https://drive.google.com/file/d/183RPkNvmmq7TrmMnLPVGYmounpT6Mmkx/view?usp=sharing
コメント
コメントを投稿