「ニューラル・ネットワークの数理 -- Tropical代数入門」の講演ビデオと講演資料を公開しました

【 「ニューラル・ネットワークの数理 -- Tropical代数入門」講演ビデオと講演資料を公開しました 】 

4月末に開催したマルレク「ニューラル・ネットワークの数理 -- Tropical代数入門」講演ビデオと講演資料を公開しました。 

今回の資料公開に際して、セミナーのまとめページ「ニューラル・ネットワークの数理 -- Tropical代数入門」 https://www.marulabo.net/docs/tropical/ の構成を、YouTubeへの参照を中心にしたものから、pdf資料の表示を中心にしたものに、全面的に書き換えました。

数学的な議論を追うのに、YouTubeはあまり向いていません。今度のページでは、pdfは簡単に全文スクロールできるようになっています。是非、ご利用ください。

-------------------------------------------------

私たちが日常的に利用している「生成AI」にしろ「大規模言語モデル」にしろ、それらが「なぜ、そのように振る舞うことができるのか?」については、わかっていないことがたくさんあります。

近年、これらのモデルの背後にある数学的構造を解明することで、その謎を解こうという取り組みが活発に進められています。

このセミナーで紹介している L. Zhang らの理論は、大規模言語モデルの振る舞いを co-presheaf 意味論を導入して説明しようとした Tai-Danae Bradleyらの理論と並んで、そうした取り組みの代表的なものの一つだと思います。

  Tropical geometry of deep neural networks,
  Liwen Zhang, Gregory Naitzat, and Lek-Heng Lim.
 
 https://arxiv.org/abs/1805.07091 

Zhangは、現代のAI技術の基礎であり、そのすべてで利用されている、Deep Neural Network(DNN) に数学的モデルを与えることを目指し、それに成功します。

古典的には(1969年)、MinskyらがRosenblattらの一つの層しか持たない単純なニューラル・ネットワーク Perceptronでは、「線形分離可能」なものしか学習できないことを明らかにしたのですが、Zhangらのモデルは、Multi-Layer Perceptron (これもDNNの別名です)が、どのように多くのものを学習できるかについて、明確な理論を提供するものです。

彼らの理論の数学的枠組みは、Tropical Geometry あるいは Tropical Algebra と呼ばれているものです。奇妙な名前ですが、きちんとした代数幾何の理論です。しかも深い理論です。

この名称は、ブラジル人の数学者の仕事をフランス人の数学者が紹介するときにつけたものなのですが、この分野の大家のDiane McLagen女史は、「このTropicalという形容詞に深い意味はない。それはフランス人のブラジルに対する見方を代表しているだけだ。」と痛烈に批判しています。

このセミナーは、ニューラル・ネットワークの基本を振り返りながら、ニューラル・ネットワークの数学的基礎理論の候補として最近注目が集まっているTropical代数の初等的な解説と、そうした認識の実際のAI技術への応用の紹介を行っています。

【 セミナーの構成 】

セミナーは四つのパートに分かれています。以下その概要を紹介します。

 ●  はじめに

このセクションでは、なぜ、今Tropical代数に注目するのかを、「理論的理由」と「実践的理由」の二つの面から解説しています。ここでは、「実践的理由」について確認します。

現在の「人工知能」技術は、非常に高価で大規模な、大量の電力を消費するシステムによって支えられているということが、「人工知能」技術の発展自身にとっても足かせになりつつあるという問題意識を、少なくない人が抱きつつあります。次の「人工知能」技術のイノベーションは、まさにこうした領域で生まれる可能性が高いのです。

Tropical代数は、単純化して言うと、掛け算が足し算に置き換わる奇妙な計算の世界です。「人工知能」システムで、大きな計算パワーを必要とし、大量の電力を消費しているのが行列とベクトルとの掛け算であることを考えると、Tropical代数が、実際的な技術変化への客観的な要請を実現する可能性を秘めていることに期待が集まっているのです。

事実、前回のセミナーで紹介した「1−bit LLM」は、理論的にTropical代数に基づいて構築されたものではないのですが、実践的には、16bitの浮動小数点同士の掛け算を、8bitの整数の足し算に置き換えるという実装で、驚異的なパフォーマンスを生み出しています。

 ●  Part 1 DNNの構造を考える

このセクションでは、DNNの構造の基本を確認しています。

現代のニューラル・ネットワークをベースとした「人工知能」技術に興味を持つ技術者には、是非とも理解してもらいたい内容で構成されています。

DNNをグラフとして捉えるにせよ、「関数の合成」として捉えるにせよ、切り口は多少異なりますが、結局は同じ対象の振る舞いを見ていることを、ご自身の知識と照らし合わせて、このセクションで記述されているZhangらのDNNの数学的モデルの理解に挑戦する中で確認してもらいたいと思います。

このセミナーの後半は、新しい数学が導入されて少しとっつきにくいのですが、このPart 1 の内容は、知識の整理としても役にたつと思います。

 ●  Part 2 Tropical 数学入門

このセクションは、Tropical数学の初等的な解説です。

Tropical 代数での足し算と掛け算の定義と、実際の計算の理解は容易だと思います。是非、ベクトルと行列の計算も、理解してもらえればと思います。

Tropical 多項式 𝑝 は、複数のTropical単項式のTropical和 ⊕で定義されます。pを構成するTropical 単項式は、ある線形写像の値を取ります。Tropical和 ⊕ の定義から、Tropical 多項式 𝑝 の値は、これらの単項式が作る線形写像の組から、最小の値を取るもので決まります。

Hypersurface V(p) は、どの点で、最小の値を持つ線形写像が切り替わるかを示します。この点では、2つの単項式の線形写像は、同じ値を持ちます。

Hypersurface V(p)からNewton図形の導出を、具体例で説明しています。

 ●  Part 3 ニューラル・ネットワークの数理

ここからが、Zhangらの論文の紹介です。ここでは、彼らがどのような問題意識を持って、どのような結果を得たのかを紹介しようと思います。

「ディープ・ニューラル・ネットワークは、人工知能、コンピュータ・ヴィジョン、音声認識、自然言語処理など、さまざまな分野のアプリケーションで大きな成功を収め、最近脚光を浴びている。 しかしながら、ディープ・ニューラル・ネットワークの有効性に関する我々の理論的理解がまだ不完全であることもよく知られている。」

「我々の研究の目的は、ニューラルネットワークとTropical幾何学のつながりを確立することである。それがDeep Neural Networkの仕組みに光を当てることを期待している。」

「我々は、ReLUを持つfeed forward neural networkに注目し、それらがTropical代数における有理関数、すなわち、2つのTropical多変数多項式f、gの商の類似物であることを示した。... 実際、我々は次のことを示す。ReLU 線形ユニットと整数の重みを持つfeed forward neural networkで表現される関数の族は、まさにTropical有理写像の族である。」


【 セミナーの資料へのアクセスについて 】

セミナーは四つのパートには、個別にも全体を通してもアクセスできます。

--------------------------
全体を通して見る
--------------------------

 ●  「ニューラル・ネットワークの数理 -- Tropical代数入門」セミナーの講演ビデオ全体の再生リストのURLです。
全体を通して再生することができます。
https://www.youtube.com/watch?v=a5gtX1Ml-8k&list=PLQIrJ0f9gMcMGr9v2_pVQw-jufmMecHqv&index=1

 ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。

「ニューラル・ネットワークの数理 -- Tropical代数入門 」講演資料
https://drive.google.com/file/d/1YWzDjX4E_tDeErUVOql0dWA0mPLhrrlK/view?usp=sharing


--------------------------

パートごとに見る
--------------------------

 ●  はじめに

   講演ビデオURL : 
https://youtu.be/a5gtX1Ml-8k?list=PLQIrJ0f9gMcMGr9v2_pVQw-jufmMecHqv

   講演資料 pdf
https://drive.google.com/file/d/1ZWq6ame6mZday9V1NrI3CcHO4vRhPkFk/view?usp=sharing


 ●  Part 1 DNNの構造を考える

   講演ビデオURL : 
https://youtu.be/fySJyVhHAdU?list=PLQIrJ0f9gMcMGr9v2_pVQw-jufmMecHqv

   講演資料 pdf
https://drive.google.com/file/d/1ZtMEoNKdj6DODjhWO6Ti4HD9KkZ1lk_T/view?usp=sharing


 ●  Part 2 Tropical 数学入門

   講演ビデオURL :
https://youtu.be/75IVS80bklY?list=PLQIrJ0f9gMcMGr9v2_pVQw-jufmMecHqv

   講演資料 pdf :
https://drive.google.com/file/d/1_7B6GBtNKiAlEkyb5mGqFeN5cYBiRd-O/view?usp=sharing


 ●  Part 3 ニューラル・ネットワークの数理

   講演ビデオURL :
https://youtu.be/7GqYecQ8AbY?list=PLQIrJ0f9gMcMGr9v2_pVQw-jufmMecHqv

   講演資料 pdf :
https://drive.google.com/file/d/1_Sp9kHI37UqZUI87QgXossQSSyDsFUM-/view?usp=sharing

-----------------------------

今回のセミナーのまとめページはこちらです。
「 ニューラル・ネットワークの数理 -- Tropical代数入門 」https://www.marulabo.net/docs/tropical/


セミナーに向けたショートムービーの再生リストはこちらです。ご利用ください。
「 ニューラル・ネットワークの数理 -- Tropical代数入門 」
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcOI0QVy2PA1LT_IuuLp97Qs

---------------------------

コメント

このブログの人気の投稿

初めにことばありき

密度行列とは何か?

「複雑性理論」は「複雑系」の議論とは別のものです