GPT-4 Technical Report と GPT-4 System Card

【 なぜ、二つの文書が同時に公開されたのか 】

このセッションでは、今回のセミナーで取り上げる GPT-4 Technical Report の概要を見ておこうと思います。

前回も述べましただ、このレポートは実際には二つの文書から構成されています。第一の文書が "GPT-4 Technical Report" で、第二の文書が "GPT-4 System Card" です。

第一の文書 "GPT-4 Technical Report" では、まず GPT-4の重要な成果として、次のことが述べられています。

 ⚫️ GPT-4は、マルチモーダルであること
 ⚫️ モデルの開発の主な目標は、複雑で微妙な意味のあるシナリオのもとでも、自然言語テキストを理解し生成する多言語の能力を向上させること
 ⚫️ プロジェクトの重要な課題は、幅広いスケールで予測可能な振る舞いをする深層学習インフラを構築することであった

レポートは、GPT-4の成果のみを強調している訳ではなく、次のように述べます。

「 GPT-4は、その性能にもかかわらず、以前のGPTモデルと同様の制限がある。すなわち、完全に信頼できるわけではなく(例えば、「幻覚」に苦しむことがある)、コンテキストウィンドウは限られており、経験から学ぶことはない。GPT-4の出力を使用する際には、特に信頼性が重要な文脈では注意が必要である。」

「 GPT-4 の能力と限界は、重要かつ全く新しい安全上の課題を生み出すものである。社会的影響の可能性を考慮すると、これらの課題を慎重に検討することは重要な研究分野であると考える。」

だから、成果だけでなく、こうした問題にフォーカスしたレポートが必要だということになります。

「このレポートは、バイアス、偽情報、過信、プライバシー、サイバーセキュリティ、急激な拡散など、我々が予測するリスクのいくつかを記述した広範なシステムカード(Appendixの後)を含んでいる。」

二つの文書が公開されたということは、GPT-4をその成果だけからではなく、その問題点からも考えなければならないということを意味しています。

第二の文書 "GPT-4 System Card" は、次のような課題を担っています。

「第一に、このモデルの限界(微妙に偽りのある説得力のある文章を作成する)と能力(不正なアドバイスを巧妙に提供する、商業的だけでなく軍事的にも両面で性能を発揮しうる、非常時の危険な振る舞いなど)がもたらす安全上の課題を明らかにする。」

「第二に、OpenAIがGPT-4の配備準備のために採用した安全プロセスの概要を説明すること。これは、測定、モデルレベルの変更、製品およびシステムレベルでの介入(監視やポリシーなど)、そして外部の専門家の関与にまたがる作業であった。」

ただ、重要なのは、この文書が担っている 第三の役割です。

「最後に、我々の緩和策やプロセスは、GPT-4の挙動を変化させ、ある種の悪用を防ぐことができるものの、その効果は限定的で、ある場合には脆いままであることを実証した。これは、先を見越しての計画とガバナンスの必要性を指摘するものである。」

この "GPT-4 System Card"  文書は、いろいろ手を尽くしたがGPT-4は危ういままであることを実証した文書であるというのです。

二つの文書の公開は、おそらく多くの人が感じている以上に、OpenAI自身が考えているGPT-4の危険性の認識が、強く深いものであることを示すものだと僕は考えています。

-------------------------------------

「 GPT-4 Technical Report と GPT-4 System Card 」を公開しました。
https://youtu.be/J7z6Dg79VHU?list=PLQIrJ0f9gMcPPRFNzbnEKyPPybVFmaz0a

資料 pdf「 GPT-4 Technical Report と GPT-4 System Card 」
https://drive.google.com/file/d/1TLjqIJzKqWMqlsXY8RPuNgeO2jbhQeWc/view?usp=sharing

blog:「なぜ、二つの文書が同時に公開されたのか 」
https://maruyama097.blogspot.com/2023/05/gpt-4-technical-report-gpt-4-system-card.html

「GPT-4 Technical Report を読む」まとめページ
https://www.marulabo.net/docs/gpt-4-technical-report/

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について