3/30 マルレク「マトリョーシカとトロピカル」講演ビデオと講演資料の公開です

【 3/30 マルレク「マトリョーシカとトロピカル」講演ビデオと講演資料公開しました 】

だいぶ遅れてしまって申し訳ないのですが、3月に開催したマルレク「マトリョーシカとトロピカル -- AI技術の最近の動向について」の講演ビデオと講演資料を公開しました。  

奇妙なタイトルですが、現在のAI技術の動向について知る上で基本的な情報を取り上げています。

このセミナーは二つのトピックスを取り上げています。

【 マトリョーシカ 】

embeddingは、自然言語やコードなどの様々なコンテンツの意味や概念を、多次元ベクトル空間の一点の座標を表す数字の列で表現する技術です。embeddingは、現代のAI技術のもっとも革新的で基本的な技術です。

embedding技術も日々発展を続けています。embedding技術の最近の動向で、もっとも注目をあつめているのが、「マトリョーシカ表現学習」と呼ばれるものです。(図 1)

「マトリョーシカ」embeddingが可能にした柔軟で高速なAdaptive Retrieval 技術は、RAG (Retrieval-Augmented Generation)という形で、既にほとんど全てのベンダーのの生成AIエンジンに組み込まれています。 

【 トロピカル 】

このセミナーが取り上げているもう一つのトピックは、現在の生成AIのベースになっている大規模言語モデル LLM のアーキテクチャーの見直しの動きです。

その見直しの中心は、浮動小数点からなる行列計算の簡略化です。行列計算の中で、浮動小数点同士の掛け算を整数の足し算に還元することができれば、大幅にエネルギー消費を削減することが可能になります。「トロピカル」というタイトルは、掛け算が足し算になる不思議な代数理論である「トロピカル代数」から借用したものです。

セミナーでは、こうしたアプローチで行列演算でのエネルギー消費を 1/70 にすることに成功したという「1-bit LLM」といわれる驚くべき提案を紹介します。(図 2)

【 Ai技術のダウンサイジング化のはじまり 】

このセミナーでとりあげた「マトリョーシカembedding」と「1-bit LLM」は、それぞれ異なった分野のそれぞれに独立した取り組みなのですが、ある共通の方向を向いていると感じています。

それは、「AIのダウンサイジング化」が始まっているということです。

現在では、誰かが高価で巨大なシステムを専有し、開発者も一定程度の性能のハードを持つことが、AIシステム あるいは AIソフトウェア開発の前提になっているのですが、その前提は、いつか変わるだろうと僕は考えています。

スマホでも処理できる低次元のembeddingを柔軟に活用することを可能にする「マトリョーシカ」は、クライアント側の高性能なAIアプリを可能にします。

大規模言語モデルの「1bit」化をめざす「量子化」の方向は、もちろん、AI巨大システムのダウンサイジングを可能にします。

セミナーの冒頭の Part 1 「AI技術の最近の動向について」では、こうした視点を提供しています。

-------------------------------

このセミナーで紹介しているのは、主要に、次の3つの論文す。

  "Matryoshka Representation Learning"
  https://arxiv.org/abs/2205.13147

  "The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits"
  https://arxiv.org/abs/2402.17764

  “BitNet: Scaling 1-bit Transformers for Large Language Models”
  https://arxiv.org/abs/2310.11453

-------------------------------

セミナーは三つのパートに分かれています。個別にも全体を通してもアクセスできます。

--------------------------
全体を通して見る
--------------------------

 ●  「マトリョーシカとトロピカル」セミナーの講演ビデオ全体の再生リストのURLです。
全体を通して再生することができます。

https://www.youtube.com/playlist?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR

 ●  講演資料全体を一つのpdfファイルにまとめたものはこちらです。

「マトリョーシカとトロピカル 」講演資料

https://drive.google.com/file/d/1NP7LbCGl-JG5mlYsrFyMaKPqPL6ixhTR/view?usp=sharing

--------------------------
パートごとに見る
--------------------------

 ●  Part 1 AI技術の最近の動向について

   講演ビデオURL : 
https://youtu.be/Y81F95HqMNI?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR

   講演資料 pdf
https://drive.google.com/file/d/1NeCT-h3odFHKWESjPUhrNGcLW8wz0f3u/view?usp=sharing

 ●  Part 2 embedding技術の新しい展開

   講演ビデオURL :
https://youtu.be/qYMeslsHMc8?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR

   講演資料 pdf :
https://drive.google.com/file/d/1Nhut1hoID6B-K9bswiNBQ24BOC8_i-5h/view?usp=sharing

 ●  Part 3 大規模言語モデルのアーキテクチャーの見直し

   講演ビデオURL :
https://youtu.be/qlJmPaWmH14?list=PLQIrJ0f9gMcP1xkr3hJI1JsTqqV0ZRpqR

   講演資料 pdf :https://drive.google.com/file/d/1No0H7LMLwo1y0YbYtnKHlrr42cR14bXL/view?usp=sharing

-----------------------------

今回のセミナーのまとめページはこちらです。

「マトリョーシカとトロピカル」
https://www.marulabo.net/docs/matryoshka/

セミナーに向けたショートムービーの再生リストはこちらです。ご利用ください。

「マトリョーシカとトロピカル  -- エピソード」
https://www.youtube.com/playlist?list=PLQIrJ0f9gMcNgPyZdLjxMZ18wWLGwLpup

---------------------------

コメント

このブログの人気の投稿

初めにことばありき

密度行列とは何か?

「複雑性理論」は「複雑系」の議論とは別のものです