3/30 マルレク「マトリョーシカとトロピカル」講演ビデオと講演資料の公開です
【 3/30 マルレク「マトリョーシカとトロピカル」講演ビデオと講演資料公開しました 】
だいぶ遅れてしまって申し訳ないのですが、3月に開催したマルレク「マトリョーシカとトロピカル -- AI技術の最近の動向について」の講演ビデオと講演資料を公開しました。
奇妙なタイトルですが、現在のAI技術の動向について知る上で基本的な情報を取り上げています。
このセミナーは二つのトピックスを取り上げています。
【 マトリョーシカ 】
embeddingは、自然言語やコードなどの様々なコンテンツの意味や概念を、多次元ベクトル空間の一点の座標を表す数字の列で表現する技術です。embeddingは、現代のAI技術のもっとも革新的で基本的な技術です。
embedding技術も日々発展を続けています。embedding技術の最近の動向で、もっとも注目をあつめているのが、「マトリョーシカ表現学習」と呼ばれるものです。(図 1)
「マトリョーシカ」embeddingが可能にした柔軟で高速なAdaptive Retrieval 技術は、RAG (Retrieval-Augmented Generation)という形で、既にほとんど全てのベンダーのの生成AIエンジンに組み込まれています。
【 トロピカル 】
このセミナーが取り上げているもう一つのトピックは、現在の生成AIのベースになっている大規模言語モデル LLM のアーキテクチャーの見直しの動きです。
その見直しの中心は、浮動小数点からなる行列計算の簡略化です。行列計算の中で、浮動小数点同士の掛け算を整数の足し算に還元することができれば、大幅にエネルギー消費を削減することが可能になります。「トロピカル」というタイトルは、掛け算が足し算になる不思議な代数理論である「トロピカル代数」から借用したものです。
セミナーでは、こうしたアプローチで行列演算でのエネルギー消費を 1/70 にすることに成功したという「1-bit LLM」といわれる驚くべき提案を紹介します。(図 2)
【 Ai技術のダウンサイジング化のはじまり 】
このセミナーでとりあげた「マトリョーシカembedding」と「1-bit LLM」は、それぞれ異なった分野のそれぞれに独立した取り組みなのですが、ある共通の方向を向いていると感じています。
このセミナーで紹介しているのは、主要に、次の3つの論文す。
"Matryoshka Representation Learning"
https://arxiv.org/abs/2205.13147
"The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits"
https://arxiv.org/abs/2402.17764
“BitNet: Scaling 1-bit Transformers for Large Language Models”
https://arxiv.org/abs/2310.11453
-------------------------------
セミナーは三つのパートに分かれています。個別にも全体を通してもアクセスできます。
--------------------------
全体を通して見る
--------------------------
● 「マトリョーシカとトロピカル」セミナーの講演ビデオ全体の再生リストのURLです。
全体を通して再生することができます。
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR
● 講演資料全体を一つのpdfファイルにまとめたものはこちらです。
「マトリョーシカとトロピカル 」講演資料
https://drive.google.com/file/d/1NP7LbCGl-JG5mlYsrFyMaKPqPL6ixhTR/view?usp=sharing
--------------------------
パートごとに見る
--------------------------
● Part 1 AI技術の最近の動向について
講演ビデオURL :
https://youtu.be/Y81F95HqMNI?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR
講演資料 pdf
https://drive.google.com/file/d/1NeCT-h3odFHKWESjPUhrNGcLW8wz0f3u/view?usp=sharing
● Part 2 embedding技術の新しい展開
講演ビデオURL :
https://youtu.be/qYMeslsHMc8?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR
講演資料 pdf :
https://drive.google.com/file/d/1Nhut1hoID6B-K9bswiNBQ24BOC8_i-5h/view?usp=sharing
● Part 3 大規模言語モデルのアーキテクチャーの見直し
講演ビデオURL :
https://youtu.be/qlJmPaWmH14?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR
講演資料 pdf :https://drive.google.com/file/d/1No0H7LMLwo1y0YbYtnKHlrr42cR14bXL/view?usp=sharing
-----------------------------
今回のセミナーのまとめページはこちらです。
「マトリョーシカとトロピカル」
https://www.marulabo.net/docs/matryoshka/
セミナーに向けたショートムービーの再生リストはこちらです。ご利用ください。
「マトリョーシカとトロピカル -- エピソード」
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNgPyZdLjxMZ18wWLGwLpup
---------------------------
コメント
コメントを投稿