正月なので少し寄り道 (2) – ChatGPT の先生はこんな人

【 正月なので少し寄り道 (2) – ChatGPT の先生はこんな人 】

今回のセッションも、少し寄り道です。
テキストだらけで長いですが、内容は理論的なものではなく具体的なものです。

ChatGPTには、人間の先生がいます。今回は、ChatGPTの陰に隠れて、あまり人の目には触れることのない、この生身の先生たちにスポットを当てようと思います。

彼ら先生たちは、ChatGPTが成長を始める最初のステップで、ChatGPTが学習するテキスト・データ(質問とその答え)を作ります。

また、次のステップで、先生たちが作ったこの質問と答えに対して、「いい」から「悪い」まで7段階に評価します。この評価作業も先生たちの仕事です。

この評価データは、最終ステップでのChatGPTの強化学習に利用されます。

ChatGPTの、その立ち上がりを担ういわばブートストラップの過程には、この人間の先生たちの関与が不可欠なのです。

実は、この先生たちにも先生がいます。

それは、彼らを雇ったOpenAIの技術者たちです。彼らは、雇った先生たちに、詳細な指示とサンプルを提供します。今回紹介したのは、OpenAIから先生たちに与えられた、問題の作成サンプルと、回答・評価のガイドラインです。

先生たちがどんな問題と回答を作成し、それらにどんな評価を与えたかを知ることはできないのですが、ChatGPTの直接の先生たちが、ChatGPTを教育するために、どんな働きをしていたのかは、よくわかると思います。

僕は、このサンプル集を見て、OpenAIがChatGPTにどんな働きを期待していたのかが、よく分かったと感じました。その中には、まだ試していない機能もありました。

長いので、ここでその内容を紹介することはできませんが、ぜひ、スライドのpdf をご覧ください。面白いです。

資料が長いので、普段はあまり使わない機械翻訳を下訳に使いました。DeepL すばらしい! 

最後に紹介しているのは、この先生たちに、評価作業のために提供されたWebアプリのスクリーン・ショットです。評価のランクづけだけじゃなく、暴力的・性的内容等が含まれていないか等のメタ評価項目が含まれているのがわかります。

 --------------------------------

「ChatGPT の先生はこんな人 」 を公開しました。
https://youtu.be/JHIT2D0q2Zg?list=PLQIrJ0f9gMcOX9oSKXRR87BgMkql5dvrx

資料pdf
https://drive.google.com/file/d/1VWHkBcspbJRsKOKW_8vbq2woe1GhibU_/view?usp=sharing

blog:「正月なので少し寄り道 (2) – ChatGPT の先生はこんな人 」https://maruyama097.blogspot.com/2023/01/2-chatgpt.html

まとめページ
https://www.marulabo.net/docs/chatgpt/

1/14セミナー「なぜ?で考える ChatGPT の不思議」の申し込みページはこちらです。https://chatgpt.peatix.com/





コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について