ボイスAIはAI利用拡大のゲームチェンジャー 3

【 メディアのマルチモーダル化について 】

マルチモーダルなAIへのAI技術の展開は、新しいインターフェースの開発とそうしたインターフェースを搭載した新しいデバイスの登場を準備します。それがAIをめぐる開発競争の、次の段階での重要な舞台になると僕は考えています。

ただ、それを「インターフェース」の問題としてだけで考えるのは、近未来の予測としては狭いのだと感じています。

「感じる」というのは、曖昧に思われるかもしれません。それは僕が技術的な「予測」というより、これまでなかった何か新しいものが生まれるかもしれないという「予感」レベルの話をしているからかもしれません。

ただ、そうした「予感」には、根拠がないわけではありません。(「予感」は、まだ見ぬ未来を考える上では重要なものだと、僕は考えています。)

少なくとも、近現代の電気・電子的なメディアは、その長くはない歴史の中でも、マルチモーダル化のいくつかの波を経験しています。

電信から電話へ:これは「信号」(これはテキストの亜種と考えられます)から「音声」へのマルチモーダル化です。信号から音声へという同じモーダルの変化が、次の例でも現れます。電話はリアルタイムで「双方向性」を持つという点では画期的なメディアだと思います。

無線通信からラジオへ:ここでは、信号から音声へというモーダルの変化とともに、「1対1」から「1対多」というモードの変化が重要です。ただし、ラジオには「双方向性」はありません。

ラジオからテレビに:テレビは、基本的にはラジオの特性(「音声」「一対多」「一方向」)を引き継いだまま、それに「イメージ」を追加したマルチモーダル化です。

とても雑なまとめですが(インターネットの話がぬけていますね)、ここで僕が強調したかったことは、メディアのマルチモーダル化は、その利便性によって多くの利用者を獲得し、それまで存在しなかった新しい強力な産業を創出する、とても強い力を持っていたということです。

メディアのマルチモーダル化は、決して同じ産業構造上の同一のデバイス上での「インターフェース」の進化ではありませんでした。それは、新しいデバイス(電話・ラジオ・テレビ等)を産み出し、新しい産業を台頭させ、産業構造を変えました。

21世紀初頭に起きたIT産業の再編は、インターネットという新しいメディアの上での、クラウドとクラウド・デバイスであるスマートフォンの利用者の拡大によって引き起こされました。その勝者であるGAFAMの時代は、この四半世紀続いています。

スマートフォンという「賢い電話」は、もっと賢くなると思います。そうした進化は、新しい産業を育てていくと思います。その突破口は、AIのマルチモーダル化によって引き起こされると、僕は考えています。

---------------------------------

ショートムービー「 メディアのマルチモーダル化について 」を公開しました。
https://youtu.be/B4y76rmyq1M?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU

ショートムービー 「 メディアのマルチモーダル化について 」のpdf資料
https://drive.google.com/file/d/183RPkNvmmq7TrmMnLPVGYmounpT6Mmkx/view?usp=sharing

blog : 「 メディアのマルチモーダル化について 」
https://maruyama097.blogspot.com/2023/10/aiai-3.html

blog : 「 メディアのマルチモーダル化について  2」
https://maruyama097.blogspot.com/2023/10/aiai-4.html

セミナーに向けたショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU

マルレク「AIの利用とインターフェースを考える」のまとめページ
https://www.marulabo.net/docs/personalai/


コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について