単純な例を見つける
【 単純な例を見つける 】
今回のセッションは、結合確率なぜ、大規模言語モデルは、数学が苦手なのか? Joint distributionと周辺確率分布 Marginal distributionの話です。
ある分布を考える時、通常は、年齢についての分布を見るとか、性別についての分布を見るとか、特定の一つの分類基準に従ってその分布を考えます。それに対して、結合確率分布では、年齢と性別といった複数の分類基準の分布を同時に考えます。
といっても難しいことではなく、結合分布の具体的なイメージとしては、あるイベントの参加者を、横方向に年齢別に縦方向に性別に分類してカウントした数字が並んでいる表計算の表を考えればいいと思います。周辺分布というのは、この表の縦横の「小計」に当たるものです。これらの数字から、確率を得るには、これらの数字を、全体の数「総計」で割ればいいのです。
表が与えられれば、縦横の小計はすぐに計算できるのですが、表の小計だけから表の各セルの値を見つけることはできません。同じことで、結合確率分布から周辺確率分布は計算で求めることができるのですが、逆の操作、周辺確率分布から結合確率分布を求めることはできません。
結合確率から周辺確率を計算する過程で、元の情報は失われます。小計を取って、足して10になることが分かったとしても、もとのそれぞれの数字がなんだったかはわからないのと一緒です。
ところが、古典的確率論を量子論的確率論に拡大すると、量子論的確率論で周辺確率に対応するものから、もとの分布の結合確率が復元できます。次回、そうしたことを示してみようと思います。
Tai-Daneの論文を読み返しているのですが、最初はなんとも思わなかったのですが、彼女が挙げている結合確率分布の例が、絶妙に「簡単」だということに気づきました。簡単ですが、議論の本質を捉えている例になっています。
簡単な例を見つけるって、難しいんですね。
------------------------------
https://www.marulabo.net/docs/density2/
コメント
コメントを投稿