GPTをAI Assistantアプリに カスタマイズする

 【 AI利用のインターフェースを 劇的に変えるAI Assistant アプリ 】

このセッションでは、OpenAi DevDayで発表された、GPTの能力をユーザーが開発したアプリの上で自由に生かすことを可能にするAssistant APIの概要を見ていきます。

また次回以降のセッションでは、OpenAIが同時に開発を進めていたAIのマルチモーダル化の成果を、今や、AI Assistant アプリの形で、ユーザーが利用できることを紹介したいと思います。

これまで、ChatGPTの利用のスタイルは、OpenAIのサイトにログインして直接ChatGPTと向き合って対話を続けること、具体的にはキーボードとスクリーンを通じてChatGPTとテキストを交換するのが基本でした。このスタイルが大きく変わろうとしています。

ユーザは、場合によればそのアプリの背後にAIがいることを全く意識せずに、普通のスマートフォンアプリと同じように画面タッチでボタンを押したり、スワイプしたりすればいいのです。僕が一番気に入っているインターフェースは、アプリに声で話しかけ、アプリが声で答えるというものです。

重要なことは、こうしたアプリを、OpenAIだけでなく開発者なら誰でも作成できるということです。OpenAIは、こうしたアプリの開発・流通を促進するためのマーケットを用意しています。

AI Assistant アプリ(これを、OpenAIはGPTsと呼んでいるようですが、ChatBotといういいかたもよく使われているようです)の登場は、一般のユーザーとAIとの距離をとても身近なものに劇的に変えるだけではありません。

それは、IT技術者・開発者とAIの距離を大きく変えるものです。

IT技術は・開発者は、これまで 、github copilot等を利用して、主要に開発支援ツールとしてAIを利用してきました。これからは、AIに支援された強力な独自のアプリを、自分の手で開発し、それを多数のユーザーが待つ市場に送り出すことができるのです。

このセミナーの前半では、人工知能技術の転換点を、翻訳モデル、大規模言語モデル、ChatGPTの三つに見てきたのですが、マルチモーダル化したAI Assistant アプリの登場が第四のマイルストーンになるのは確実だと、僕は考えています。


【 Assistant とは何か 】

こうした転換の中心的装置は、ソフトウェア的に見れば、Assistant というオブジェクトです。

OpenAIは、Assistantをこう説明しています。

「Assistantとは、OpenAI APIの場合、GPT-4のような大規模な言語モデルからパワーを得て、ユーザーのためにタスクを実行することができるエンティティのことを指す。
これらのアシスタントは、モデルのコンテキストウィンドウ内に埋め込まれた命令に基づいて動作する。
また、アシスタントは通常、コードを実行したり、ファイルから情報を取得したりするような、より複雑なタスクを実行できるツールにもアクセスできる。」

開発者が、開発した独自アプリの中に、このAssistantを構築するツールが、Assistant API です。開発者が作成したアプリの中にAssistantが構築されると、

「アシスタントは指示を持ち、モデル、ツール、知識を活用してユーザーの問い合わせに応答することができる。」


【 Assistant, Tread, Message, Run 】

Assistant API で重要な役割を果たすのは、Assistant, Tread, Message, Run という四つのオブジェクトです。

これらは、次のように関係しています。

 ・Assistant を作成する。それは、モデルに対する指示を定義し、モデルを選択することで、必要であれば、Code Interpreter、Retrieval、Function callingなどのツールを有効にする。
 ・ユーザーが会話を開始すると、Threadを生成する。
 ・ユーザーが質問する際に、TreadにMessageを追加する。
 ・Thread上でAssistantを実行(Run)して、応答をトリガーする。これにより、関連ツールが自動的に呼び出される。

スライドに、Assistant API で利用される基本的なObjectの働きをまとめておきました。


【 こんなアプリが開発できる 】

Assistant API を使うと、こんなアプリが開発できます。

アプリに、「退職後の財政プランだけど、そのために毎年どれくらい準備しておいたほうがいいかな?」と聞くと、アプリは「年間6万円ほどは、今から積み見立ておいたほうがいいと思います。さらに ... 」といろいろ教えてくれます。

このアプリは、一般的なフィナンシャル・アプリではなく、このアプリのユーザーだけにカスタマイズ化されているのが、ポイントです。

それは、ユーザーの退職後の財政プランを立ててくれる、ユーザーだけの パーソナル・アシスタント「僕の財政ボット」なのです。

Assistantは、AIが独自アプリの機能を支援するという意味だと思いますが、AI Assistant アプリの開発が拡大して普及すれば、Assistantは、「AIが、個人の生活を支援してくれる」、パーソナル・アシスタンスのためのツールだと、語義が拡大・転化する時が来るように思います。


--------------------------------


ショートムービー「 GPTをAI Assistantアプリに カスタマイズする 」を公開しました。
https://youtu.be/pqIMLKPoJf4?list=PLQIrJ0f9gMcNtKtfdBjlaXfsG8hWl3cQm

「 GPTをAI Assistantアプリに カスタマイズする 」のpdf資料https://drive.google.com/file/d/1bniLACwYFkvHxTHTTnJmmyWaMd9aq7aH/view?usp=sharing

blog 「 AI利用のインターフェースを 劇的に変えるAI Assistant アプリ 」
https://maruyama097.blogspot.com/2023/11/gptai-assistant.html

ショートムービーの再生リスト
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNtKtfdBjlaXfsG8hWl3cQm

角川セミナー 「ChatGPTはどう変わろうとしているのか」まとめページ
https://www.marulabo.net/docs/kadokawa1124/

角川セミナー 「ChatGPTはどう変わろうとしているのか」申し込みページ


コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について