お勉強は大変だ

3月 08, 2022

【お勉強は大変だ】

数学的証明の場合には、ゲームの場合のように、セルフ・プレイで訓練用データをいくらでも提供できるわけではないことを先に見て来ました。

それでは、Open-AI Theorem Proverには、まず最初に、どのような訓練用データが提供されたのでしょうか？ここでは、それをみていこうと思います。もちろん、このデータを選択し提供したのは、人間です。

Open-AI Theorem Prover に与えられたのは、次の三つの訓練用データです。

　1. miniF2F-curriculum
　2. synth-ineq
　3. mathlib-train

以下、それがどんなものか概略を紹介しましょう。

1. の"miniF2F-curriculum" の主要部分は、数学オリンピックにチャレンジしようとする中高生向けに、LehoczkyとRusczykがつくった問題集 “The Art of Problem Solving” https://www.amazon.co.jp/-/en/Sandor-Lehoczky/dp/0977304566 からの抜粋です。ベンチマークの miniF2Fの試験をいい成績で通るように、人間の手で、327の問題が選ばれています。もちろん、それはLeanの言葉に変換・翻訳されています。

https://github.com/openai/miniF2F/blob/statement_curriculum_learning/lean/src/statement_curriculum_learning/aopsbooks.lean に、全体が公開されていますので、ご覧ください。

2. の"synth-ineq" は、もっと強烈です。
Leanでは「等式」の証明には、便利なtactics があります。以前のショートムービー「Open-AI Theorem Proverが行う証明」https://youtu.be/BAvCsZFGQKQ?list=PLQIrJ0f9gMcPP8LOejaQQlYufAMEQbcdg で紹介した問題1, 問題5で利用されていた "linarith" は、そうしたtactic の一つです。

ただ、不等式の証明は、基本的には、代入・変形で解ける等式の証明より少し面倒です。先のショートムービーで紹介した、数学オリンピックの問題4, 問題6 も不等式の証明問題でした。

Open-AI は、こうした問題に対応するために、「Cauchy-Schwarzの不等式」や「 Bernoulliの不等式」等の不等式で表される定理を可能な限り集め、かつそれらを組み合わせて、不等式型の定理を生成する特別のプログラムを作りました。

2. の"synth-ineq" は、こうして作られた 5,600の定理を集めたものです。Open-AI Theorem Proverは、この5,600もの不等式の定理を、最初に学ぶのです。

これって、受験に向けて「傾向と対策」を考えたり、苦手対策の特訓をするのと似ていませんか？　人間だけでなく、機械にとっても、数学のお勉強は大変なんです。

それらと比べえると、3. の"mathlib-train" は、オーソドックスなものです。それは、基本的な数学的推論を学ぶための、訓練データだと考えていいと思います。

【「彼は、何を学習したのか？」を公開しました】

https://youtu.be/VvtGSjRfCtg?list=PLQIrJ0f9gMcPP8LOejaQQlYufAMEQbcdg

スライドのpdfは、こちらからアクセスできます。https://drive.google.com/file/d/1tXZAaQS7EqPDmpBEIUjvj7mRmGOaOsZ2/view?usp=sharing

このトピックのまとめページは、こちらです。ほぼ毎日更新されると思います。https://www.marulabo.net/docs/math-proof/

セミナーへのお申し込みは、こちらからお願いします。
https://math-proof.peatix.com/

このブログを検索

過去・現在・未来

お勉強は大変だ

コメント

コメントを投稿

このブログの人気の投稿

初めにことばありき

密度行列とは何か？

宇宙の終わりと黒色矮星