投稿

2025の投稿を表示しています

AIと「世界モデル」2

 【 AIと「世界モデル」2  −− 昔の話をしよう 】 このセッションでは、Rodney Brooks の 1987年の論文 “Intelligence without representation” を紹介します。 Rodney Brooks は、SHRDLUの「成功」以降のAI研究の「停滞」の原因を鋭く指摘し、新しいAI研究の道を示した重要なAI研究者です。 もっとも、彼の理論は、当時のAI研究の主流派に受け入れられた訳ではありませんでした。 ただ、彼の理論は、ロボット研究の理論と実践に広く深い影響を与え、その影響は今日も続いています。Brooksは、iRobot社の最高技術責任者で、ルンバの開発者です。 【 Intelligence without representation −− Abstract 】 その論文のAbstractで彼は、次のように述べます。 「人工知能の研究は、表現の問題で停滞している。 知能を段階的にアプローチし、知覚と行動を通じて現実世界とインターフェースすることに厳密に依存すると、表現への依存は消える。」 人工知能研究の停滞の原因は、「表現の問題」であるとされています。 「知能システムの根本的な分解は、相互に表現を介してインターフェースする必要がある独立した情報処理ユニットへの分解ではない。」 「代わりに、知能システムは、相互に特に多くのインターフェースを必要とせず、知覚と行動を通じて世界と直接インターフェースする独立した並列の活動生成ユニットに分解される。」 「中央システムと周辺システムの概念は消滅し、すべてが中央であり周辺でもある。」 こうした見方を、”Subsumption  Architecture” (“SA”と略されます)といいます。 【 "Use the world as its own model !" −− この論文のメッセージ 】 この論文に込めたBrooksのメッセージは、論文冒頭の Introduction に明確に示されています。 「我々は、このアプローチに従って、一連の自律移動ロボットを構築してきた。その結果、予想外の結論(C)に達し、かなり過激な仮説(H)を立てた。 (C) 非常に単純なレベルの知能を調べると、世界に関する明示的な表現やモデルは単に邪魔になるだけであることがわ...

AIと「世界モデル」

 【 AIと「世界モデル」 −− 昔の話をしよう 】 #DeepMind 先のセッションで、DreamerV3の「世界モデル」の概略を見てきました。今回のセッションは、もちろん、DreamerV3の「世界モデル」にインスパイアされたものですが、その画期性へのアプローチを変えてみようと思います。 今回のセッションでは、AIがその発展の歴史の中で、どのように「世界」に関わろうとしたのかを、その「世界モデル」論にフォーカスして振り返ってみようと思います。 【 昔の話をしよう 】 今回と次回のセッションで、次の二つのトピックを取り上げます。  ● Winograd – SHRDLU  ● Brooks – Intelligence without representation 前者は 1970年、後者は 1987年の論文の話ですので、50年から 30年近く昔の話です。 老人の昔話は、一般的には、あまり役には立ちません。でも、今日のような激しい時代の変わり目には、少しは、役立つだろうと思っています。今回と次回のセッションのテーマは、「昔の話をしよう」です。 【 SHRDLUのアーキテクチャと能力 】 SHRDLUは、1968年から1970年にかけてMITのテリー・ウィノグラードによって開発された、自然言語理解のための統合システムです。このシステムは、自然言語パーサー、意味解釈器、推論器、そして「積木の世界(Blocks World)」を操作するためのエフェクターから構成されています。 「積木の世界」は、色付きのブロックやピラミッドなどで構成される単純な仮想環境であり、SHRDLUはユーザーの命令に基づいてこれらのオブジェクトを操作します。 SHRDLUの最も注目すべき能力は、積木の世界に関連する英語の命令や質問を理解し、応答することです。 こんな対話が可能でした。 −−−−−−−−-−−−−---------− [ HUMAN  ] 大きな赤いブロックを取って。 [ SHRDLU ] OK。 (画面上でロボットアームが動き出す。図のように、小さな赤いブロックと大きな赤いブロックの2つが見える。大きなブロックの上には緑色の立方体が積み重ねられている。ロボットはまず緑色の立方体をテーブルの上に移動させ、次に赤いブロックを拾う。) [ HUMAN  ] ...

6月マルレク「AI とマインクラフトの世界」予告編

【  6月マルレク「AI とマインクラフトの世界」予告編 】 6月のマルレクは、「AIとマインクラフトの世界」というテーマで開催しようと思います。 AIの利用者は、この一年で大きく拡大しました。 IT系の人は、コード生成にAIを普通に使うようになりましたし、ジブリ画像の生成はちょっとしたブームになりました。学生のレポートでもSNSへの投稿でも、AIの利用は日常の風景の一部になりつつあります。僕も、最近はAIによる「音声概要」を愛用しています。 【 AIとゲーム? 】 マインクラフトは、多くの人はご存知だと思いますが、有名なゲームです。僕もアカウントを持っています。現在の開発元は、Microsoft社です。 問題は、急発展を続けるAIの世界とゲームの世界とに、どのようなつながりがあるかということです。 今回のセミナーで紹介するAiは、役にたつプログラムを教えてくれるわけでも、面白い画像を作ってくれるわけでも、レポートを書いてくれるわけでもありません。 DeepMind社のAI DreamerV3は、ひたすらゲームをするAIなのです。 次のDreamerV3のGitHubのトップページを見てください。 h ttps://github.com/danijar/dreamerv3   DreamerV3は、Minecraftに限らず、数多くのゲームをプレイすることのできるAIなのです。 DreamerV3のゲームでの強さをよく示すのが、Minecraftで難しい課題の一つである、「ダイアモンドの発掘」に成功したことです。 【 AI Agentの自律性 】 本当は、Minecraftゲームの紹介をもう少し詳しくしないと、DreamerV3の達成の意味が分かりにくいのですが、それだけだとつまらないですね。 ここでは、もう少し一般的なコンテキストから、DreamerV3の行ったことの意味を考えてみようと思います。 現在のAIの進化をAIのAgent化、大雑把に言って、AIの「自律性の拡大」として捉えることは、正しいと思います。 ただ、AIの自律性が何を意味するかについては、よく考える必要があります。 前回のセミナーで見た、ソフトウェア開発サイクルの変化の中でのAI Agentの役割は、AIがLLMモデルの成功によって獲得した人間のことばの意味を理解する能力に基...

DreamerV3の何が画期的なのか?

【 DreamerV3の何が画期的なのか? 】 DreamerV3は、昨今話題のAI Agentの一種です。ただ、このAI Agentは、皆さんの身近にいる「コードを書いてくれる」 AI Agentとは、一味違っています。 前回のセッションでは、DreamerV3を「ゲームをするAI Agent」として紹介してきました。それだけでは彼が可哀想です。 今回のセッションでは、なぜ、この「ゲームをするAI Agent」が「コードを書いてくれるAI Agent」以上に画期的なのかを考えてみたいと思います。 【 視点を切り替えよう 】 ひたすらゲームをするだけのAIが、コードを書いてくれるAIより「画期的」だと思うには、視点の切り替えが必要かもしれません。 それは、簡単なことです。我々がAIに何を期待しているのかを改めて考えること、一言で言えば、AIを作る人の視点を持つことです。そのためには、AIを作るとか何かのAIのプロジェクトに参加する必要はありません。そうした視点を「想像」するだけで十分です。 技術が関わる世界には、その技術を使う人とその技術を作る人がいます。IT技術者は、これまでは、技術を作る側の一端に立っていました。ただ、AI技術に関しては、IT技術者は最も熱心なAI技術の利用者になろうとしています。ひたすらAIを使うだけだと、IT技術者にとっては、あまりいいことないと僕は思います。 実は、「想像」は、夢見るDreamerV3のキーワードの一つです。 【 世界のモデルと未来を想像する力 】 DreamerV3の基本的な論文のタイトルは、”Mastering diverse control tasks through world models”です。 「多様な制御タスクを世界モデルを通じてマスターする」 世界モデルってなんでしょう? この論文に、とても印象的な一節があります。 "The algorithm is based on the idea of learning a world model that equips the agent with rich perception and the ability to imagine the future" 「このアルゴリズムは、エージェントに豊かな知覚と未来を想像する能力を付与する世界のモデ...

5月マルレクへの招待

【  5月マルレクへの招待 】 ==================== セミナーへのお申し込みはこちらからお願いします。 https://sdlcagent.peatix.com/view ==================== 5月のマルレクへのお誘いです。  5月のマルレくは、「ソフトウェア開発サイクルの変革とAI Agent の動向」というテーマで開催します。 AI技術の発展が、社会のあらゆる分野に深い影響を及ぼすだろうということは、さまざまな人がさまざまな形で語っています。 今回のセミナーは、「あらゆる分野」にではなく、僕を含むソフトウェア開発につらなる世界に、AIがどのような変化をもたらすのかを考えようとしたものです。   IT技術は、インターネットにしろスマートフォンにしろSNSにしろ、世界のあり方を大きく変えてきました。 IT技術者にとって、IT技術は、こうした変化の能動的な主体であり、それ以外の世界は変化を受ける受動的な客体であると考えても、大きな不都合はありませんでした。 ただ、AIという武器を得た新しいIT技術が、変えようとしている世界の一つに、他ならぬITの世界そのものが含まれていることには注意が必要です。 新しいIT技術が、変革の対象として選ぼうとしているのが、ソフトウェアの生産現場です。対象リストの中で、その優先順位はとても高いと僕は考えています。 【 セミナーの構成 】 セミナーは、次のような構成を考えています。 第一部: ソフトウェア開発でのAI利用の動向 第二部: ソフトウェア開発とAI Agent 第三部: ソフトウェア開発の課題と未来 【 第一部: ソフトウェア開発でのAI利用の動向 】 セミナーでは、まず、ソフトウェア開発でのAI利用の動向を確認したいと思います。 この分野へのIT技術者の関心は高く、さまざまなプロダクトが登場しています。そこでは、AI ベンダートップの楽観的な見通しと強気な発言が特徴的です。膨大な投資がなされています。 同時に、セキュリティに関心を持つ人の間では、かつてないほどの規模で AIに対する警戒心が広がっているように見えます。また「攻撃者としてのAI」からシステムを守る「防御者としてのAI」という議論も活発に展開されています。 【 第二部: ソフトウェア開発とA...

ADK: コード開発パイプライン・サンプル

【  コード開発パイプライン・サンプル 】 今回のセッションでは、Googleの”Agent Development Kit Tutorial“の、とても簡略化された「コード開発パイプライン」サンプルを紹介したいと思います。 サンプルのソース・コードはこちらから見ることができます。 https://google.github.io/adk-docs/agents/workflow-agents/sequential-agents/#how-it-works 【 何が「簡略化」されているのか? 】 この「コード開発パイプライン」は、’simplified’とあるように、実際のコード開発の現場で行われているいくつかの側面を捨象したコード開発のモデルをAIで実装したToyプログラムです。 現在のプログラム開発の自動化の取り組みは、このサンプル・プログラムのレベルよりは、大分進んでいます。 ただ、この簡略化されたサンプルはプリミティブで制限付きのものですが、AI Agentを利用した開発自動化モデルの原型(Ur-Type)と考えていいと、僕は考えています。 そうした「進化」を確認するためにも、まず、最初に、このモデルでは何が「簡略化」されているのかを考えてみたいと思います。 この「コード開発パイプライン」のモデルには、「テスト」工程も「デバッグ」工程もありません。 【 現在の開発自動化の取り組み 】 現在の開発自動化の取り組みについては、今回のセミナーに向けたセッション「ソフトウェア開発へのAI Agent導入の動向」の資料で 、ソフトウェア開発におけるAIエージェントの導入の現状を、特に次の各領域に焦点を当てて紹介してきました。  ・コード補完  ・テスト  ・デバッグ  ・コードレビュー https://drive.google.com/file/d/1NZKV4hTy8SrUuJvvT0Sxllk9boAjg6eY/view 主要AIエージェントの機能と性能(SWE-bench)は、表にまとめました。 これらについては、「AI Agent導入の動向 (音声による概要)」が簡便にまとめています。参照ください。 https://www.marulabo.net/wp-content/uploads/2025/05/AI%E3%82%A8%E3%83%BC%E...

A2A: Travel Agent サンプル

【 A2A: Travel Agent サンプル 】 このセッションでは、Multi AI Agent プログラミングのサンプルとして、三つのAgentを協調させて、一つのTravel Agent サービスに統合するプログラムを紹介します。 このサンプルは、A2Aプロトコルの採用を決めたMicrosoftが、GoogleのA2A GitHubに、最近、投稿したものです。 https://github.com/google/A2A/tree/main/samples/python/agents/semantickernel このサンプルは、Multi Ai Agent の開発でのA2Aプロトコルの利用の紹介にもなっています。 【 基本的なコンポーネント 】 このMulti AI Agent のプログラムは、基本的には、次の三つのコンポーネントから構成されています。  ・SemanticKernelTravelManager  ・CurrencyExchangeAgent  ・ActivityPlannerAgent それぞれのコンポーネントの働きをみておきましょう SemanticKernelTravelManagerは、ユーザーからのリクエストを受け取り、それを分析する中央のコーディネーターとして機能します。コンテキストに基づいて、これらのリクエストを専門のエージェントにインテリジェントにルーティングします。 たとえば、通貨関連のクエリは CurrencyExchangeAgent に直接送信され、観光の予定や旅程関連の要求は ActivityPlannerAgent に転送されます。 CurrencyExchangeAgentは、通貨関連のタスクを処理します。Frankfurter API などの外部 API ツールを統合し、リアルタイムの通貨為替レートを提供します。これらのデータソースを活用することで、エージェントは正確な予算編成と財務計画を実現します。 ActivityPlannerAgent は、ユーザーの好みや予算に応じて、カスタマイズされた旅程の提案、アクティビティ、イベント予約を提供し、パーソナライズされた旅行体験をキュレーションします。 【 タスクのルーティングと委任 】 Multi Agentの協調と統合が、どのように行われているのかを考える上では...

Multi AI Agent プログラミング

【 Multi AI Agent プログラミング 】 このセッションでは、AI Agent プログラミングの基本を、あらためて確認したいと思います。これまでの展開とは、少し切り口とトーンが変わっています。 ここでは、AI Agent を用いた実装が、どういう意味で「新しい」のかという、もっとも基本的なポイントを概説しています。 【 現在の技術的焦点 】 AI Agent プログラミングの発展が向いている先が、ソフトウェア開発ライフサイクル(SDLC)の自動化であることは、前回のセッションで見たようにSDLCの「部品」に当たるものの開発が急ピッチで進んでいることからもわかると思います。 ただ、「部品」ではなく、SDLCのそのもののAI エージェント化のコードをずっと探していたのですが、なかなか見つかりません。 そのことは、現時点でのAI Agent プログラミングの技術的焦点が、SDLCそのもののAI Agentかを進めるためにも、ネットワーク上に存在する複数の AI Agent をどのように協調させて、一つの統合されたサービスを作るのかにあることを意味していると思います。 部品から全体を構成する方法を明確にすることが必要なのです。その課題に、当面、フォーカスしようと思います。 【 具体的なプログラムから考えよう 】 セミナーのタイトルに掲げたテーマ「ソフトウェア開発サイクルの変革 」からは、回り道になりますが、今後のいくつかのセッションで、複数の AI Agentを利用する Multi AI Agentプログラミングの基本を確認したいと思います。 切り口を変えたついでに、しばらくの間、技術を紹介するスタイルも変えてみようと思っています。具体的なプログラムのサンプルから、Multi AI Agentプログラミングの基本を確認するスタイルを取ってみようと思います。 例えば、Multi AI Agent の協調と統合を支える基本的なプロトコルは、A2A(Agent-to-Agent)、MCP(Model Context Protocol)なのですが、これらのプロトコルを形式的に説明する前に、こうした技術を必要としたプログラムのサンプルを説明したいと思います。 A2A,MCPのキチンとした説明は、後のセッションで行います。 【 具体的なコードから気づいたこと 】 いくつかの...

ソフトウェア開発へのAI Agent導入の動向

【 ソフトウェア開発へのAI Agent導入の動向 】 #SDLC 先のセッションでは、AIの能力の飛躍的な発展がさまざまな分野で進む中で、AIが持つcode生成能力をソフトウェア開発に利用しようという関心が高まっていることを見てきました。 その関心のフォーカスは、個別のプログラムの個別的な開発でのAIの利用にとどまらず、もっと広いソフトウェア開発サイクルそのものでのAIの利用の可能性に向かっています。 AIをソフトウェア開発に利用しようという流れ、あるいは、AIそのものを開発しようという流れの中で、一つの変化が起きました。それは、AIの働きを「AI エージェント」として捉える見方が急速に広がったことです。 【 「AI エージェント」 と 「マルチ・モーダルAI」 】 「AI エージェント」論が登場するのに、少し先行して、大規模言語モデルベースのAIにも大きな変化が起きました。それは、テキスト・ベースのチャットAIから、「読むことも書くことも、聞くことも話すことも、目で見ることも絵を描くこともできる」「マルチ・モーダルAI」への変化です。 「マルチ・モーダルAI」の成立は、機械の中に人間の「身体性」を含む感覚運動的諸能力の対応物を見つける可能性を開きました。それは、機械論としては、一つの画期をなすものです。 二つの変化は、ほぼ同時に起きました。二つは、相補的ですが関連しています。 「AI エージェント」論は、我々人間が、具体的な人間の諸能力の中に機械によって現実的に代替可能なものの候補を見つける過程と結びついています。 従来の人間中心のSDLCでは、各フェーズで人間の判断と作業が主体でした。しかし、プロジェクトの複雑化、市場投入までの時間短縮への要求、エンジニアの負担増といった課題が顕在化しています。AIエージェントは、これらの課題に対する解決策として期待されています。 例えば、AIエージェントは24時間365日稼働でき、反復的なタスクを疲れ知らずにこなし、人間が見落としがちなパターンやエラーを検出する能力を持つ可能性があります。 【 AIエージェントの登場と進化 】 このセッションでは、ソフトウェア開発におけるAIエージェントの導入の現状を、特にコード補完、テスト、デバッグ、コードレビューの各領域に焦点を当てて見ていきたいと思います。 次の4つのセクションの詳細は...

5月マルレク

【 マルレク「ソフトウェア開発サイクルの変革とAI Agent の動向」予告編 】 #SDLC 5月のマルレクは、「ソフトウェア開発サイクルの変革とAI Agent の動向」というテーマで開催します。 MaruLaboでは、この間、ソフトウェア開発とAIとの接点について、マルラ・ボエームさんの 「AIエージェント講座」を始めてきました。 今回のセミナーは、この流れを受け継ぐものです。 【 今回のセミナーの二つの直接的なきっかけ 】 今回、「ソフトウェア開発サイクルの変革とAI Agent の動向」というテーマで、マルレクを開こうと思ったのには、直接的には、二つのきっかけがあります。 最初のきっかけは、5月初めの Metaのザッカーバーグ氏の「今後、18ヶ月でコードの100%をAIが生成する」という発言を目にしたことです。 https://www.ndtv.com/world-news/ai-will-do-most-of-coding-soon-better-than-top-coders-mark-zuckerberg-8311461   「そんな、予測が本当にできるの?」 よく読むと、世の中のコードがそうなるというわけではなく、「MetaのLlamaプロジェクト向けのコードの大部分がAIによって書かれるだろう」という話だったのですが。 ただ、調べてみると他のAIベンダーのビジネス上の発言も、強気なものでした。 もう少し詳しく背景を調べてみようと思いました。 【 攻撃者としてのAI 】 もう一つのきっかけは、4月28日から5月1日まで、サンフランシスコで開催された、RSAC 2025の 栄藤さんのレポートを読んだことです。 「RSAC2025 ルポ(3日目午前の途中速報、Exhibition巡りはこれから)」 https://note.com/mick_etoh/n/neb6bae3782b7   衝撃を受けました。 論点は多岐にわたるのですが、「AIが攻撃者になれば、セキュリティの最大の敵はAiになるだろう。その時、人間は勝てるだろうか?」という危機意識を多くの人が抱いていることは理解できました。 【 二つのトレンドをどう考えるか?】 問題は、この間僕が強い印象を受けた二つのトレンドが向いてる、方向が必ずしも一致しているわけではないということ...

音声による概要紹介

【 音声による概要紹介 】 #Column マルレクのコラム「現在・過去・未来」の音声による概要紹介を始めました。 「ショート・ムービー」と言いながら30分を超えて誰もみてくれなかったり、「リール動画」は話の最初の数十秒で切れて何も伝わらなかったり。マルレクのたびに、その概要を伝えるのに苦労していました。 AIが生成した、音声による概要のまとめは違います。 充分短いですが、ちゃんと完結したストーリーで概要を語ってくれます。 素晴らしい! 【 5月のマルレク・コラム 】 5月には、次の四つのコラムを投稿しました。  ・「145億年間、宇宙を旅した光子の物語」  ・「1 + 196883 = 196884」  ・「ラマヌジャンのMoonshine」  ・「不思議な数」 【 音声による概要へのアクセス 】 次のリンクを辿っても、playerが開いて、音声による概要を聞けます。  ・「145億年間、宇宙を旅した光子の物語」 https://drive.google.com/file/d/1beTEfZeYsMGefYcwr3y_v_aVNX1S2_Oq/view?usp=sharing  ・「1 + 196883 = 196884」 https://drive.google.com/file/d/1bMpmK72S1_aBmyEwfP3141D18OYAl3Pg/view?usp=sharing  ・「ラマヌジャンのMoonshine」 https://drive.google.com/file/d/1bRe8DGEsZghnVQXKTd4zfdxBE4lPMACo/view?usp=sharing  ・「不思議な数」 https://drive.google.com/file/d/1beTEfZeYsMGefYcwr3y_v_aVNX1S2_Oq/view?usp=sharing ただ、コラムの「まとめページ」に、直接、音源を埋め込みました。こちらからのアクセスの方が簡単です。 https://www.marulabo.net/docs/column 【 音声概要のサンプルを紹介しています 】 AIが生成した音声概要のサンプルをビデオでは紹介しています。 冒頭の部分だけを切り出したものですが、僕の「ショート・ムービー」や「リール」とは、全く違うのがわかるとと思います。 と...

不思議な数

【 不思議な数 −− e の (π√163)乗 】 今回も、数の一致の話です。ただ、これまでの例とは違って、厳密な一致ではなく計算から非常に近いことが予想されるという近似的な一致です。 ラマヌジャンは、数ページにわたる複雑な計算をして、どう見ても整数には見えない e の (π√163)乗という数が、整数262537412640768744 に極めて近いことを確認しました。 この整数に見えないけど整数かもしれない数は、「ラマルジャンの定数」と呼ばれることもあります。もっともこの呼び方は、人気の数学コラム「数学ゲーム」で1975年にマーティン・ガードナーがつけたものですが、この数を紹介した回は、エープリル・フールに当たっていて、冗談・フェークが満載です。彼のコラムにあるように、ラマルジャンがこの「定数」を整数だと推論した事実はありません。 【 他にもある、整数に「近い」数 】 この一致(正確にいうと近似がなりたつこと)は、偶然でしょうか、それとも他の理由があるのでしょうか? 実は、整数に「近い」とされる数は、他にもあります。先の例を含めてまとめてみましょう。   e の (π√163)乗 : 262537412640768744   e の (π√67)乗   : 147197952744   e の (π√43)乗   : 884736744 これらの数には共通点があります。それは、末尾の3桁がいずれも 744  になっていることです! この一致は、偶然でしょうか、それとも他の理由があるのでしょうか? 【 744 は特別な数 】 コラムの後半では、今回取り上げた「ラマヌジャンの定数」と前々回紹介した「Moonshine予想」との世界には深い結びつきがあることを紹介したいと思います。 簡単にいうと、Moonshine予想」の世界にも、特別な数として 744  という数字が現れるのです。 二つの世界を、744 という数字が結びつけているというのは言い過ぎですが、二つの世界には、744という数字を含む共通の数学的構造が横たわっています。 【 163 も特別な数 】 「ラマヌジャンの定数」に現れる 163 という数字も、実は、特別な数です。 そのことを説明するためには、ラマルジャンと同じように、数字と数式に対して特別に鋭敏な洞察力を持って...

ラマヌジャンのMoonshine

【 ラマヌジャンのMoonshine 】 #Column 今回も、前回のコラムと同様に、思いがけない「数の一致」の発見についての物語です。 【 「数の一致」の不思議 】 数の一致の観察自体は、誰にも説明可能で、誰にも理解可能なものです。振ったサイコロの目が丁なのかなのか半なのか、ルーレットのボールが39に落ちたのか38に落ちたのか皆の認識が一致しないのなら、ギャンブルは成り立ちません。 不思議なのは、この個別的で具体的で客観的な出来事が、観察者の主観に、個別性を超えた抽象的な、しかも正しい洞察を生み出すことがあるということです。 今回のコラムで紹介するのも、そうした例の一つです。 確かに、経験からの帰納と演繹的な推論の間には、ギャップがあります。 ただ、人間のものであれ機械のものであれ「知能」と呼ばれる能力の、大きなそして不思議な特徴の一つは、そのギャップを飛び越える力があることだと、僕は感じています。 もっとも、哲学的には、そうした議論は古色蒼然としたテーマなのですが、「考える機械」の登場という時代のコンテクストの中で、あらためて、認識の飛躍する力、新しい認識を生み出す能力、想像し創造する人間の力について考えてみたいと思っています。 【 1729 は面白い数? 】 世の中には、数字について並外れた直感を生まれつき備えている人がいます。インド生まれの数学者ラマヌジャンも、そうした天才の一人だったと言われています。 彼は、乗ってきたタクシーのナンバー 1729 を、「何の変哲もない数だよね」という友人に対して、即座に 「1729は、とても面白い数字です。それは2通りの2つの立方数の和で表せる最小の数です」と答えたそうです。     1729 = 12^3 + 1^3 = 10^3 + 9^3 と表せますし、そうした数では最小になるので、これは正しいんです。 子供の頃、このエピソードを初めて聴いた時、なんて素晴らしい能力なのだろうと驚嘆したことを覚えています。 ただ、やがて次のことに気づきました。ラマヌジャンは、9の三乗が729で、12の三乗が 1728 であることを、知っていたんだと。    1729 = 1728 + 1 = 1000 + 729 おそらく彼は、二桁程度の数の二乗、三乗、四乗くらいまでは、みな頭の中に 入っていたのだと思...

1 + 196883 = 196884

【 1 + 196883 = 196884  −− ある数学的認識の飛躍の物語 】 このコラムのタイトル「1 + 196883 = 196884」 は、当たり前すぎて、かえって意味不明かもしれません。 ただ、もしも、あなたのクレジット・カードの最初の6桁の数字に1を足したものが、あなたのマイナンバーカードの最初の6桁の数字と完全に一致していたとすれば、この式は、単なる足し算以上の意味を持ちます。 もっとも、クレジット・カードとマイナンバー・カードの場合、こうした数字の一致は、全くの偶然と考えていいと思います。 このコラムの「1 + 196883 = 196884」の場合も、左側に現れる数字196883と右側に現れる数字196884は、実は、数学の別の分野から取られたものです。 ただ、クレジット・カードとマイナンバー・カードの数字の偶然の一致とは異なって、この等式は、一見無関係に見える数学の分野間の驚くべき繋がりを示唆する、重要な発見の糸口となりました。 1 + 196883 = 196884 という一見自明の等式は、20世紀の数学的認識のある飛躍の物語の、最初の主人公なのです。 【  John McKayが気づいたこと 】 1978年ごろ、McKayは、あることに気づきます。 当時は、「モンスター群」の存在は証明されていなかったのですが、FischerとGriessは、モンスター群が「存在するならば」、その最小の非自明な既約表現(最も基本的な「対称性のパターン」を捉える方法)の次元は 196883 であると予想していました。 McKayは、この数字 196883 が、数論の分野で基本的な対象である j-不変量 j(τ) の q-展開(フーリエ級数展開に類似したもの)に現れる係数 196884 に極めて近いことに気づきます。     「1 + 196883 = 196884 だろう ! 」 そればかりではありません。McKayは、さらにj(𝜏) の最初のいくつかの項の係数が、モンスター群 M の既約表現の次元 r(n) の単純な線型結合として表現できることに気づきます。 【 数学者の直感 】 先に進む前に、あらためて問題を整理しておきましょう。 第一。ここでの議論には、二つの全く異なる数学的対象、「j-不変量」と「Monster...

145億年間、宇宙を旅した光子の物語

【  145億年間、宇宙を旅した光子の物語 】 #Column 2022年に日本の天文学者が、宇宙で地球から最も遠くにある銀河を発見しました。地球から、145億光年離れた銀河です。その銀河は「HD1」と名付けられました。 宇宙がビッグバンで誕生してから148億年と言われていますので、HD1は宇宙誕生のわずか3億年後に生まれたことになります。天文学者がHD1の観測に成功したということは、彼らは145億年もの間宇宙を旅してきた光と出会うことができたということです。 【 印象的な「宇宙から見た地球」の姿 】 これまでも、私たちは「宇宙から見た地球」の姿に強い印象を受けてきました。 アポロ8号が撮影した月の地平線から地球が上る「地球の出」という写真、アポロ17号が撮影した漆黒の宇宙に青い地球が浮かんでいる「ブルー・マーブル」という写真、ボエジャー1号が撮影した太陽系の中の微かな青い点としての地球「Pale Blue Dot」等々。 それらと比べると、今回のHD1の映像は、少しインパクトに欠けているかもしれません。ただ、それが、145億年間宇宙を旅してきた光だと考えると、別の感慨が湧いてくるように思います。 【 HD1発見者のコメント 】 HD1の発見者は、こう語ります。 「宇宙が始まって間もないころ、いつどのように銀河ができたのか、天文学者は知りたいのです。そのため、遠くの銀河を探して、昔の宇宙を調べようとしているのです。光の速度はどこでも同じで、かつ、無限ではありません。遠い天体の光ほど、長い時間をかけて地球に届きます。例えば10億光年の距離にある天体からは、10億年前に出発した光が、10億年かけてやっと今、私たちの地球に届いているのです。言いかえると、10億光年先から届いた光を観測すると、10億年前の様子が見えるのです。天文学者は遠い天体を観測し、はるか昔の宇宙を調べているのです。」 「HD1 はとても明るく、こんな明るい銀河が宇宙が始まって間もなくできていることに、天文学者は非常におどろいています。現在の銀河形成の理論では、こんなに明るい銀河が、こんな昔にどのようにできたかを説明できないのです。次のステップは、HD1 のような銀河がどのように作られたのか、あるいは HD1 は実は銀河ではなくて活発なブラックホールなのではないか、を明らかにすることです。研究チー...

12/28 マルレク「ラングランズ・プログラムとは何か?」コンテンツ公開の詳細

【 科学の未来と私たちの未来 】 昨年末 12月28日に開催したマルレク「ラングランズ・プログラムとは何か? -- やさしい入門編」のビデオとコンテンツを公開しました。 このセミナーは、「ラングランズ予想」と言われるものが意味するものを、できるだけ多くの人に伝えようとしたものです。 公開コンテンツのリンクの詳細については、次のページをご利用ください。 https://maruyama097.blogspot.com/2025/04/Langlands.html 【 今なぜ「数学」について語るのか?】 21世紀の最初の25年は終わり、激動と言っていい大きな変化が進行しています。 これからの21世紀が私たちにとってどのような時代になるのか、多くの人が関心を高めていると思います。 考えるべき課題が山のように積み上がる中で、なぜ今、数学の世界について語るのでしょう? それは、現在、数学の世界で進行している変化が、21世紀の科学の未来を大きく変える可能性を持つと考えているからです。 【 ラングランズ・プログラムの重要性は、あまり知られていない 】 このセミナーで取り上げた「ラングランズ・プログラム」は、まさに、現在の数学の変化をドライブしている中心的なプロジェクトです。 今年の5月、「ラングランズ・プログラム」の基本的な予想の一つである「幾何学予想」が証明されたのは、大きな事件でした。 “Proof of the geometric Langlands conjecture” https://people.mpim-bonn.mpg.de/gaitsgde/GLC/   残念ながら、その重要性は、メディアではほとんど伝えられることはありませんでした。 【  技術の未来と私たちの未来 】 確かに、数学の世界での発見が、我々の未来に大きな影響を与えるという考えには、飛躍があると感じる人は多いでしょう。 でも、「飛躍がある」というのは、本当なのでしょうか? あるいは、なぜ、「飛躍がある」のでしょう? 核の脅威にせよAI技術にせよ、技術の未来が、私たちの未来に大きく影響を与えるということについては、多くの人がさまざまに考え、さまざまな論争があります。 それは、現代の分断と対立の舞台そのものといっていいのかもしれません。 僕は、我々の未来を技術の未来に託するのは、あまり気が進...

10/26 マルレク「カテゴリー論基礎 2」コンテンツ公開の詳細

【 10/26 マルレク「カテゴリー論基礎 2」概要 】 このセミナーは、2024年5月に行った「カテゴリー論基礎」 https://www.marulabo.net/docs/category-theory/ の続編です。 5月のセミナーでは、カテゴリー論の基本的な構成要素である、Category, Functor, Natural Transformation とは何かを概説し、その上で、LimitやCoLimit,という構成を可能にするUniversal Propertyというコンセプトを紹介してきました。 実は、カテゴリー論が誕生したときに、5月のセミナーで紹介したような Category, Functor, Natural Transformation といった基本的な概念は出揃っていました。ただ、その道具箱の中には、Adjointという概念 は含まれてませんでした。カテゴリー論に、Adjointという概念を導入したのは、Daniel Kanの仕事です。 Kanは、Adjointという概念を武器に、「Kan Extension」という枠組みを作り上げ、従来のカテゴリー論の全てを、その枠組みのもとで再構成することに成功します。  このセミナーでは、カテゴリー論における adjoint概念の役割と基本的な性質について解説しています。 【 10/26 マルレク「カテゴリー論基礎 2」講演ビデオと講演資料のURLです 】 セミナーは3つのパートに分かれています。個別にも全体を通してもアクセスできます。 -------------------------- 全体を通して見る --------------------------  ●  「カテゴリー論基礎 2」セミナーの講演ビデオ全体の再生リストのURLです。    全体を通して再生することができます。 https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNtQXc5hw-mGz_qdZdy2Sf-  ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。    「カテゴリー論基礎 2」講演資料 https://drive.google.com/file/d/1D59l8MZEkZAx4GBH-W-u0LgZyx9MuI1k...

9/28 マルレク「計算複雑性理論入門」 コンテンツ公開の詳細

【 9/28 マルレク「計算複雑性理論入門」概要 】 今回のセミナーは、前回8月のセミナーと基本的な議論は連続しています。それは、コンピュータとAI技術の次の未来を展望するうえで、人間の二つの基本的能力である「言語能力」と「数学的能力」の「統合」の課題が重要だという議論です。 そうした立場から、前回のセミナー「コンピュータと数学 -- TuringからVoevodskyまで」では、コンピュータにはそもそも「数学的能力」が備わっているのではという問題意識を述べてきました。 そこでは、コンピュータの持つ数学的能力の(再)発見の突破口となった「計算 = 証明 = プログラミング」という認識の成立の場所である「型の理論」を取り上げ、実際にコンピュータによる証明の例を紹介しててきました。 今回のセミナー「計算複雑性理論入門 -- Turingマシンから量子コンピュータまで」では、こうした論点をさらに深める上で、計算科学の代表的な数学理論である「計算複雑性理論」に注目しようと思います。 【 9/28 マルレク「計算複雑性理論入門」講演ビデオと講演資料のURLです 】 セミナーは3つのパートに分かれています。個別にも全体を通してもアクセスできます。 -------------------------- 全体を通して見る --------------------------  ●  「計算複雑性理論入門」セミナーの講演ビデオ全体の再生リストのURLです。    全体を通して再生することができます。 https://www.youtube.com/playlist?list=PLQIrJ0f9gMcOpIJC2zXYFkMmOORiA15C7  ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。    「計算複雑性理論入門 」講演資料 https://drive.google.com/file/d/1OwmBSa0kfa1X4jpELlX0p2_6JfYYlNLG/view?usp=sharing --------------------------  パートごとに見る --------------------------  ●  Part 1 計算可能性理論と計算複雑性理論    講演ビデオURL : https://yout...

8/31 マルレク「コンピュータと数学」コンテンツ公開の詳細

【 8/31 マルレク「コンピュータと数学」概要 】 「大規模言語モデル」ベースの現代の生成AI技術は、ネット上の膨大なテキストの集積を学習して、そこから、人間の「言語能力」と呼ばれているものの基本的部分 --「意味の理解」「新しい文の生成」「対話形のコミュニケーション」、「文字として蓄積された情報の活用」等 -- をコンピュータ上で実現することに成功しました。 それは画期的なものです。この連続セミナーは、歴史的な成功をおさめたAI技術の次の未来を展望することを目的としています。 僕がこのセミナーで伝えたいAIの未来についてのメッセージは次のようなものです。 それは、コンピュータには、それ自身で「数学的=論理的能力」を持っているということです。 こうした考えを進めれば、わざわざ、「大規模言語モデル」の上に数学的=論理的能力を構築しようとするのは、コンピュータが本来持つ力を過少に評価しているのであって、それは余計な回り道だということになります。 【 8/31 マルレク「コンピュータと数学」講演ビデオと講演資料のURLです 】 セミナーは3つのパートに分かれています。個別にも全体を通してもアクセスできます。 -------------------------- 全体を通して見る --------------------------  ●  「コンピュータと数学」セミナーの講演ビデオ全体の再生リストのURLです。    全体を通して再生することができます。 https://www.youtube.com/playlist?list=PLQIrJ0f9gMcPZTGr3N85yw2FFNQTWg-WJ  ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。    「コンピュータと数学 」講演資料 https://drive.google.com/file/d/1A6_DiD_xnl1zrW0lenzLPxGFxGNdRAQg/view?usp=sharing --------------------------  パートごとに見る --------------------------  ●  Part 1 機械は考えることができるか?    講演ビデオURL : https://youtu.be/paJUnTImD4M?...

7/31 マルレク「コンピュータ上のグラフ理論の進化」コンテンツ公開の詳細

【 7/31 マルレク「コンピュータ上のグラフ理論の進化」概要 】 現在のLLMベースのAIに数学的能力を統合したいというのが僕の大きな問題意識なのですが、まだまだ考えなければいけないことがたくさんあります。二つの能力の統合には、一定の時間が必要だと思います。 ただ、言語のモデルと数学のモデルとが統合されうるのであれば、両者はある共通の特徴を持っているはずです。そうした特徴は、カテゴリー論によって与えられると考えています。 当面、グラフとAgent モデルの二つを糸口にして、そうした共通の特徴を考えることから始めていきたいと思います。 【 7/31 マルレク「コンピュータ上のグラフ理論の進化」講演ビデオと講演資料のURLです 】 セミナーは4つのパートに分かれています。個別にも全体を通してもアクセスできます。 -------------------------- 全体を通して見る --------------------------  ●  「コンピュータ上のグラフ理論の進化」セミナーの講演ビデオ全体の再生リストのURLです。全体を通して再生することができます。 https://www.youtube.com/playlist?list=PLQIrJ0f9gMcPxLEAjCXf9wYkOvMB0fHzf  ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。 「コンピュータ上のグラフ理論の進化 」講演資料 https://drive.google.com/file/d/1shyrgEV9aHyYet5MMXi3RtdNFX48pFxb/view?usp=sharing -------------------------- パートごとに見る --------------------------  ●  Part 1  はじめに – 「AIとグラフ」連続セミナーの流れ    講演ビデオURL : https://youtu.be/p5bRaHBnsTI?list=PLQIrJ0f9gMcPxLEAjCXf9wYkOvMB0fHzf    講演資料 pdf : https://drive.google.com/file/d/1wdmxRfH-87-I8FQt_K0zHfgf9FhgbW4M/view?usp=sha...

6/29 マルレク「AIとグラフ」講演ビデオと講演資料 コンテンツ公開の詳細

【 6/29 マルレク「AIとグラフ」の概要 】 今回のセミナーでは、まず最初に、現在のマルチ・モーダルを指向するAI技術には、得意とする領域と不得意とする領域があることを、グラフの問題を通じて考えます。 セミナーの Part 1 「画像とグラフの違いを考える」 は、こうした実験と考察をまとめたものになります。 現在の生成AI技術が、グラフの問題をうまく処理できないだろうことは、AIの世界をいったん離れて、数学的にグラフの認識の問題を考えると、より一層明確になります。 セミナーのPart 2 「グラフの認識の難しさ」は、複雑性理論の観点から、この問題を扱います。 興味深いことは、もし、「万能の人工知能」が誕生したとしても、解けないグラフの問題があるということを数学的に示すことができるということです。こうしたメタレベルの認識は、現時点では、おそらく人間のみが可能なように感じています。 【 6/29 マルレク「AIとグラフ」講演ビデオと講演資料のURLです 】 セミナーは3つのパートに分かれています。個別にも全体を通してもアクセスできます。 -------------------------- 全体を通して見る --------------------------  ●  「AIとグラフ」セミナーの講演ビデオ全体の再生リストのURLです。 全体を通して再生することができます。 https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNh55bPi6AdHDHkfBmmK7mk ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。 「AIとグラフ 」講演資料 https://drive.google.com/file/d/1SHyd1ZN268E7ABJQAzS9RlRdzB6SczMk/view?usp=sharing -------------------------- パートごとに見る --------------------------  ●  Part 1  画像とグラフの違いを考える    講演ビデオURL : https://youtu.be/EVm_hiMP4-w?list=PLQIrJ0f9gMcNh55bPi6AdHDHkfBmmK7mk    講演資料 ...