投稿

AIの基礎となるもの -- 人間の認識能力の構造

【 AIと人間の関係を考える 】 今回のセッションは、今回のセミナーの「パーソンルなAI」「Be My AI !」というコピーの背景にある 「AIと人間との関係」をどのように考えているかを、あらためてまとめたものです。 基本的には、人間の認識能力の構造が、AI利用の基礎になるという話なのですが、結論は、楽観的なものです。何度か述べたように、僕は、AIが我々人間の手助けをするようになるだろうと考えています。 スライドは、ほとんど画像なので、ここで説明するよりも、見ていただくのが一番早いと思います。 セミナーは、明日開催です。セミナー開始の直前まで、お申し込みを受け付けています。皆様の参加をお待ちしています。 申し込みは、こちらからお願いします。 https://personalai.peatix.com/ --------------------------------- ショートムービー「 AIの基礎となるもの -- 人間の認識能力の構造」を公開しました。 https://youtu.be/_-wXtNrvfqc ?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU ショートムービー 「 AIの基礎となるもの -- 人間の認識能力の構造 」のpdf資料 https://drive.google.com/file/d/1EIHEvVdOaf9-xT66N0zVCMluds5xZaW_/view?usp=sharing blog : 「 AIと人間の関係を考える  」 https://maruyama097.blogspot.com/2023/10/ai_01066799093.html セミナーに向けたショートムービーの再生リスト https://www.youtube.com/playlist?list=PLQIrJ0f9gMcONFj6CSbKdp_mdh_81VgDU マルレク「AIの利用とインターフェースを考える」のまとめページ https://www.marulabo.net/docs/personalai/

今週末(9/28)のマルレクの講演資料公開しました。

【 今週末(9/28)のマルレクの講演資料公開しました 】 マルレク「AIの利用とインターフェースを考える」は、今週土曜日 9/28 開催です。 セミナーの申し込みページは、 https://personalai.peatix.com/ です。 お申し込みお待ちしています。 講演の概要は、次のようになっています。 ⚫️ Part 1 : はじめに -- パーソナルなAIを展望する  ・マルチモーダルなAIの登場の中でAIの未来を考える  ・ボイスAIはAI利用拡大のゲームチェンジャー ⚫️ Part 2 : メディアのマルチモーダル化から学ぶ  ・世界を変えてきたメディアのマルチモーダル化  ・マルチモーダルなメディアとマルチモーダルなAI ⚫️ Part 3 : AIのマルチモーダル化の始まり  ・「眼を持ったGPT-4」にできること -- GPT-4V System Cardを読む  ・「眼を持ったAI」の課題 -- GPT-4Vの技術的達成と限界 ⚫️ Part 4 : AIの進化と人間の役割  ・「眼を持つ機械」 -- 人間の感覚能力の拡大  ・AIの力と人間の力 -- 人間の力の再評価   [ ・DALL-E 3でのCLIPの利用  ]  [ ・人間の未来についての楽観論と悲観論 ] 概要に興味を持たれた方は、次の講演資料をご利用ください。 https://drive.google.com/file/d/1DdPQbnVkp84NvroUuuvr7qYLEDEbwy-E/view?usp=sharing お詫びしなければいけないのですが、ここには、先日予告した、CLIPのnatural language supervision と DALL-E 3の関係を論じた「DALL-E 3でのCLIPの利用」のセクションとセミナー全体のまとめとしての「人間の未来についての楽観論と悲観論」のセクションは含まれていません。 これらは、今回のセミナーからは割愛し、後日、セミナーのAppendix として公開することを考えています。 セミナー全体のまとめページは、こちらになります。   https://www.marulabo.net/docs/personalai/ セミナーに向けたショートムービーの再生リストはこちらです。 https://www.youtube

「眼を持つ機械」 -- 人間の感覚能力の拡大

【 「VisualなAI」は、どう「進化」するのか? 】 今回のセッションでは、GPT-4Vのような、マルチモーダルなAIへの志向を持つAI技術が登場する中で、それがどのような発展の可能性を持つのかを考えてみようと思います。 【 「機械」の定義 あるいは、「機械」には何ができるのか?】 最初に、以下の議論で出てくる「機械」という言葉を、僕がどのように使っているかを説明したほうがいいと思います。 時計や自動車は、もちろん、機械です。ただ、メカニカルなものだけを機械と考えているわけではありません。照明器具、冷蔵庫といった電気製品、スマホやコンピュータ等の電子機器も「機械」とみなしています。 問題は、AI です。「人工知能とは機能であって実体ではない」と考えることも可能かもしれません。ただ、僕は、AIも「機械」だと考えています。それは、現代の人工知能研究が、チューリングの「機械は考えることは可能か?」という問いから始まったと考えているからです。こうした考えによれば、人工知能とは「考える機械」のことに他なりません。 「機械」の概念の中心には、「人間が作ったもの・人工物」というのはありそうです。でも、それ自身機械とみなせる大規模な自動化工場で、機械である自動車が生産されるのなら、「機械は、人間が作ったもの」という規定は適切なものではなくなります。 チューリングが「機械は考えることは可能か?」という問題を提起した頃、フォン・ノイマンは、「自分自身と同じ機械を生み出す機械は可能か?」という問題を提起して、それを肯定的に解いてみせました。ワトソン=クリックがDNAを発見する前の話です。フォン・ノイマンのアプローチは、以前に紹介したAgent-Base-Modelの遠祖になりました。 僕に、ある「機械」のイメージがあったとしても、「機械」に属するもの、あるいは「機械」の属さないものを数え上げて、そのリストを作るのは不可能です。現在の認識から作られた「定義」を明確にすることにこだわるのは、あまり生産的ではないかもしれません。 なぜなら、こうした「機械」や「考える機械」といった言葉の定義やその言葉の含意は、時代と共に変化するものだということです。ある場合には、全く正反対のものに変わることもあります。 例を挙げましょう。今から 50年前の1970年代初め、コンピュータの専門家の中に、人工知

AIの力と人間の力 -- 人間の力の再評価

【「人間の持つ諸能力の再評価」というフェーズ 】  今回のセミナーで、AIの利用とインターフェースについて考えようとしています。この問題では、AIと人間の関係はどういうものなのかという問題が基本的だと思います。 AI研究の一つの目標は、人間とは独立の「考える機械」、機械から構成された自律した「知能」を作り上げることです。 当たり前に思われるかもしれませんが、こうしたAIを作り出そうとしているのは、人間です。人間が人間を生物学的に生み出す(procreate)ように、AIがAIを生み出す(create)わけではありません。 未来のAIがどういう力を持つのかは未知数ですが、はっきりしていることは、それは、人間の力によって生まれるだろうということです。 問題は、AIが人間とは独立の自律的な「知能」をすでに獲得しているかのような意識が生まれはじめていることです。「人間によって生み出されたAIだが、人間を超える能力を持つ存在として、人間の前に登場している」と。 僕は、そうした現象は、人間の本来持つ力が、人間の元を離れ人間の外部のAIの力としてあらわれているものだと考えています。 ただ、今回のセッションで、僕が強調したいのは、そうした深い射程を持ちうる「疎外論」とは少し違ったものです。 それは、AI研究の現段階は、「AIの能力の卓越」としてではなく、むしろ「人間の持つ諸能力の再評価」のフェーズとして特徴づけられるのではという問題提起です。 そうした認識は、ブレイクスルーをもたらしたChatGPT成立の背景分析と現在のAI技術がいまだ不十分で不完全であるという観察に基づいています。 【 機械と人間の関係 】 さきに、「人間の力が、AIの力として現れている」と言いましたが、若干の補足を。 AIと人間の関係だけでなく、AIやコンピュータを含む機械と人間の関係を考えることは意味があると思います。そこでは、人間の力が機械の力として現れているわけではありません。しばしば機械の力は人間を上回ります。 自動車より早く走れなくとも、ブルトーザーに腕力ではかなわなくとも、我々は人間は機械より劣った存在だと考えることはありません。なぜなら、それは人間にとって意味のある人間にとって役に立つ「人間の能力の拡張」だからです。 それについては、視覚能力の拡大としての機械を中心に、前回の「眼をもったAiはどう

来週のセミナーの技術的背景について

イメージ
【 来週のセミナーの技術的背景についての補足 】 来週のセミナーですが、いつものセミナーと少し違って、近未来の話をしています。 現在の技術からは、あるいはその現実的な評価からは、すこし飛躍していると感じている人も少なくないと思います。 今回のセッションでは、来週のセミナーの「技術的背景」について、すこし補足しようと思います。 実は、それについてまとめた資料があります。それは、先月のセミナー「大規模言語モデルの展開 -- マルチモーダルへ」 https://www.marulabo.net/docs/multimodal/ の「はじめて」の部分なんです。 大抵の人がそうだと思いますが、僕は資料ができてから「最後」に「はじめに」の部分を書きます。この「はじめに」は、セミナーの概要をまとめて次回のセミナーの予告をしたものでした。 「いや、そのスライドのpdfはもう読んだ」という人も多いと思います。ありがとうございます。でも、ビデオでは、スライドに書かなかったことをいろいろ「しゃべって」います。 「いやいや、ビデオも最後まで観たよ」という方もいらっしゃると思います。本当に、ありがとうございます。ご苦労様でした。 僕のテキストを読もうが読むまいが、僕のビデオを最後まで見ようが途中で止めようが、それはみなさんの選択です。僕がどうこうできることではありません。 で、じつは、こうしたやりとりをしたかったわけではありません。今回の投稿では、ビデオよりテキストが好きだという人に対して、また、テキストになってないけどビデオでは喋っているといういるという「言い訳」をしなくてもいいように、「はじめて」の次のビデオ、全文、書き起こしてテキストにしました。 https://youtu.be/dgN8KS9PLTs?list=PLQIrJ0f9gMcNq1c2SNCMXp8BbIn1XK76C ご苦労なことです。(僕がです)  でも、そうじゃないんです。簡単でした。この約30分のYouTubeの文字起こし、あっという間におわりました。 "YouTube Summary with ChatGPT & Claude" というChromeのプラグインをゲットして、YouTubeの画面から、"Transcript & Summary" というメニュ

悲観論と楽観論

【 John Baezの悲観論と楽観論 】 9月26日に John Baezの講演があった。楽しみにしていたのだが聞き漏らしてしまった。 ちょうど、9月25日にOpenAIがMultimodalなAIについての発表があったもので、そっちに走ってしまった。 ただ、スライドは公開されているので、簡単に紹介したい。 http://math.ucr.edu/home/baez/struggle/ 「 我々は完新世 Holoceneを離れ、人類の活動によって生物圏が急速に変化する人新世Anthropocene という新たな段階に入った。 我々は現在だけでなく遠い未来をも変えつつある。 しかし、人新世の問題は、地球温暖化の問題だけではないのだ。  ▶絶滅する種の割合はバックグラウンドの100~1000倍  ▶1950年以降、大型海洋魚の個体数は90%減少  ▶生物量ベースでみると、哺乳類の96%は人間か家畜になり、野生はわずか4%。  ▶植物が生産する化学エネルギーの約4分の1は、現在、人間が使用している。  ▶人間は、大気中の窒素を他のすべてのプロセスを合わせたよりも多く摂取し、その窒素をエタノールに変換している。  ▶自然のバックグラウンドの8~9倍のリンが海洋に流入している。」 人口爆発(もちろん人間の)と地球温暖化を中心とした、この辺りの彼の議論は、以前にも紹介したことがある。地球の他の生命を道連れに破滅に向かった突き進む、人間の未来については、悲観的だと思う。 ただ、今回の講演で興味深かったのは、次のフレーズだ。 「しかし、それらを考えることで、危機を乗り切る生命の能力について、楽観的になれるかもしれない。」 彼は、何を考えて楽観的になったのだろう? 「地球温暖化の中で私たちの未来に思いを馳せるとき、私たちがどうやってここまで来たのかを振り返ることには価値がある。生命が誕生した後も、地球上の生命が成功するのは当然の結論ではなかったのだ! この講演では、私たちの惑星の歴史から、スリリングでゾッとするようなエピソードをいくつか紹介する。例えば、惑星テイアとの衝突、ほとんどの海が凍った「スノーボール・アース現象」、恐竜時代を終わらせた小惑星衝突などだ。よく知られているものもあれば、理論的にしか説明されていないものもある。 しかし、それらを考えることで、危機を乗り切る生命の能

10/28 マルレクへのお誘い

【 マルチモーダルなAIの登場の中で AIの未来を考える 】 現在のAI技術の注目すべきトレンドの一つは、「マルチモーダルなAI」の登場です。 「マルチモーダルなAI」というのは、キーボードとスクリーンでテキストをやり取りすることしかできない現在のAIを、眼で見ることも、耳で聞くことも、口で話すこともできるように能力を拡張したAIのことです。 今回のセミナーでは、マルチモーダルなAIの登場という流れの中で、AIの未来を考えてみようと思います。 【  Be My AI ! --「パーソナルなAI」を展望する 】 今回のセミナーで僕が示したいと思っているのは、一言でいえば、「パーソナルなAIへ」という展望です。 自分の目や耳や口をもつAIの登場といえば、AIロボットがしだいしだいに人間を押し除けてゆく、AI優位の近未来をイメージする人も、少なくないと思います。 そうではなく、様々な局面で我々人間を支援する、あくまでも人間のために役にたつAIを考えたいと思います。 そういうAIを展望する一つの鍵は、すべての人が日常的にAIをパーソナルなアシスタントとして利用し、また、AIにとって人間のアシスタントであることが、競争的優位性を持つようにAIの未来を設計することだと、僕は考えています。   Be My AI ! 僕は、この言葉を OpenAIのドキュメントの片隅で見つけたのですが、この言葉が気に入っています。 【 メディアのマルチモーダル化は、世界を変えてきた 】 AIのマルチモーダル化の流れは、こうした展望を可能にするものでしょうか? 最初に確認したいことは、先行したメディアのマルチモーダル化は、電報、電話、ラジオ、テレビ、… といったいくつかの段階があるのですが、それらはすべてユーザーの欲求に応えたものでした。 メディアのマルチモーダル化は、ユーザーを急速に拡大し、メディアのパーソナライズ化を促進し、ビジネスとして大きな成功を収めてきました。それは、それまで存在しなかった新しい強力な産業を創出する、とても強い力を持っていたのです。 クラウドとクラウドのデバイスであるスマートフォンを中核とする現代のIT産業の基礎も、メディアの中心がインターネットへと変化する中で生まれた産業構造の変化です。 21世紀の初頭に起きたこの変化は、GAFAMの勝利の時代として、この四半世紀続いてい