投稿

図で計算する

イメージ
【 図で計算する 】 Coecke の基本的なアイデアは、語の意味を表すベクトル空間 FVect と語の文法的な型を表す P のペアからなるカテゴリー   FVect ✖️ P の中で、意味を考えるということです。 FVect ✖️ P の中で、単純な一つの語 w の意味は、意味ベクトルWと語の型pのペア(W, p)というで表されます。 語の並びとしての文の意味を考える出発点は、こうした拡張された語の意味の表現が、並んでいる状態です。     語の並び          w1            w2    ... ...      wn   語の意味の表現の並び (W1, p1)    (W2, p2)  ... ...  (Wn, pn) 問題は、それからです。次のような写像 f を考えます。      文 w1w2...wn の意味    = f( (W1, p1) ⊗ (W2, p2) ⊗ ... ⊗ (Wn, pn) ) 大事なことは、文法的な文sの導出 p1p2...pn ≧ s が情報として与えられれば、  ( f, ≧ ): (𝑊1⊗⋯⊗𝑊𝑛 , 𝑝1⋯𝑝𝑛) ⟶(S, s) は、カテゴリー   FVect ✖️ P の射であり、文法的な型 s を持つ S は文の意味と考えることができることです。この射( f, ≧ )を「語の意味から文の意味への写像」と呼びます。 今回のセッションでは、文を構成するそれぞれの語と文法の構造が、どのように語の意味から文の意味を作り出すかが、図形で表されていることをフューチャーしています。こまかな議論は省略してもいいので、図形を眺めて、こんな言語学もあるんだと感じてもらうだけで、いいかもしれません。 -------------------------------- 「 DisCoCat -- Coecke’s diagrammatic calculus」 を公開しました。 https://youtu.be/rBl6FSWiwGU ?list=PLQIrJ0f9gMcN2nXtvKCK4ApBaVglV8Drx 資料pdf https://drive.google.com/file/d/1TiN28dpoGtMwXTwLXDbaqfF8x5n17tb9/view?usp=sharing blog:「図で

数式と図式

イメージ
【 数式と図式 】  今回のセッションは、CoeckeのDisCoCat理論で大きな役割を果たす図式表現String Diagram の紹介です。 Monoidal カテゴリーの射についての等式がmonoidal カテゴリーの公理から証明可能であれば、その等式はその図形的言語であるString Diagramでも導出可能です。 また、その逆も成り立ちます。 String Diagramで図形的に導出可能な等式は、monoidal カテゴリーの公理から証明可能です。 String Diagramの「図式」は、「数式」で表現される抽象的なカテゴリー論と同値です。「数式」の方が「図式」より、正確で情報量が多いというのは、ある種の思い込みです。そのうえ、「図式」の方がずっと直感的です。(逆に、図式が成り立つことを「数学的」に「証明」するのは、少し骨が折れます。) Coeckeは、このString Diagram を使ってカテゴリー論的量子論を図解するという大胆な試みを展開していました。Coeckeのカテゴリー論的言語理論は、量子論との結びつきを強めていきます。 今回も紹介した、Cup状あるいはCap状の曲線は、Coeckeの量子論の解釈では、「エンタングルメント」状態を表すものです。かれは、この状態をYanking で直線に引き延ばすことで「量子テレポーテーション」を直感的に説明します。 こうして彼は、自然言語の意味理解に「エンタングルメント」や「量子テレポーテーション」の対応物を見つけていきます。そうした自然言語へのアプローチは、まったく新しいものです。 -------------------------------- 「 Interlude -- Monoidal categoryとString Diagram 」 を公開しました。 https://youtu.be/wk6C5F5hLhw ?list=PLQIrJ0f9gMcN2nXtvKCK4ApBaVglV8Drx 資料pdf https://drive.google.com/file/d/1czKkbonhRCXtaMjTAMeEiAizOLIE3qS5/view?usp=sharing blog:「数式と図式」 https://maruyama097.blogspot.com/2022/12/blog-pos

Coeckeが考えたこと

イメージ
【 Coeckeが考えたこと 】 今回は、DisCoCat の出発点となった Bob Coecke らの2010年の論文を紹介します。 かれの問題意識は、明確でかつ意欲的なものです。 「意味の記号論と分散意味論は、ある意味直交する競合する理論である。それぞれに長所と短所がある、前者は構成的だが定性的で、後者は非構成的だが定量的である。」 認知科学の分野でも、こころのコネクショニスト的モデルと記号論的モデルの間に、同じような立場の違いが存在します。 Coeckeが考えたことは、この二つの陣営の対立を乗り越える道はないのかということです。 僕自身は、知能のコネクショニズム的モデルでは人間の知能を構成する重要な特徴である「数学的能力」を説明できないと考えて「計算主義的」な知能のモデルに、強く惹かれていました。その意味では、Coeckeの問題提起とその「解決」の提案は、とても興味深いことでした。今では、こうした方向が正しいだろうと考えるようになりました。 ポイントは、二つの陣営の対立を乗り越えるのに、カテゴリー論を利用しようということです。 「文法としてのPregroupが特に興味深く、我々がそれを使用する動機となったのは、カテゴリー論的な観点に立つと、それがベクトル空間やテンソル積と共通の構造を持つということである。」 このあたりは、先日紹介した、Functor SemanticsについてのLawvereの言葉と同じものです。ただ、彼は、対立する陣営が、対立はしているものの、それぞれがその「市民」である「第三のカテゴリー」を具体的に発見します。 「ベクトル空間、線形写像、テンソル積のカテゴリも、Pregroupも、いわゆるcompact closedカテゴリと呼ばれるものの例である。具体的には、Pregroupでの型の並置は、monoidalカテゴリーのmonoidalテンソルに対応する。」 「文の意味を計算する数学的構造は、意味と型の二つを組み合わせたcompact closedカテゴリーとなる。」 素晴らしい! -------------------------------- 「 DisCoCat -- Coecke’s original form 」 を公開しました。 https://youtu.be/Y6ltrMZPijk ?list=PLQIrJ0f9gMcN

数学的説明を少しスキップしました

イメージ
【 数学的説明を少しスキップしました 】 これまでやろうとしていたことは、語から構成される文の文法性と語の意味から構成される文の意味を関連づけるために、この二つの「構成性」を結びつけるFunctorを利用しようということでした。 こうしたアプローチをFunctorial  Semanticsというのですが、この理論の創始者であるローヴェールは、興味深いことを言っています。 「二つのものを概念的に関連づけるためには、それらが共に共通のカテゴリーに属している必要がある。すなわち、数学的に言えば、両者が当初は異なるカテゴリーに属すると考えられていたのであれば、まず第一に、両者をFunctor的に、共通の第三のカテゴリーに移動させる必要がある。」 「しかし、もし両者を関連づけるこの試みが成功したならば、その時には、 こうした関連付けすべての最も明快な説明には、両者自身がもともと、この第三のカテゴリーの「市民」であったことを示すことを含まれているだろう。」 今回の例でしたら、文を構成する文法のカテゴリー PregX と意味をベクトルとして分散表現するカテゴリーFVectの、二つのカテゴリーが登場します。この二つのカテゴリーは、異なるものです。 ローヴェールのFunctorial Semantics のフレームを利用するためには、この二つのカテゴリーが、ともに共通の第三のカテゴリーに属することを言わなければなりません。 前回のセッションでは、「次回」にすなわち「今回」にそのことを説明すると言っていたのですが、残念ながら、今回のセッションでは、短い時間の中で、そのきちんとした説明をすることができませんでした。 「第三のカテゴリー」は何かの答えはわかっています。PregXもFVectも、ともに、monoidal categoryのcompact closed categoryに属します。ローヴェールの言い方を借りると、文法のカテゴリー PregXも意味を表現するカテゴリー FVectも、共に、compact closedなカテゴリーの「市民」なのです。 monoidal カテゴリーのグラフィカルな表現であるString Diagramについては、以前のセミナー「String Diagram を学ぶ -- カテゴリー論入門 (1)」で紹介したことがあります。 https://www.

chatGPTにケチをつけたいわけではないこと

イメージ
【 chatGPTにケチをつけたいわけではないこと 】 今回のセッションから、新しい内容、カテゴリー論を用いた構成的分散意味論を紹介しようと思います。  基本的な問題意識は、「文の意味は、個々の語の意味と、語から文を構成する文法規則によって構成的に決定される」という構成性の原理を文の意味論においても適用することです。 こうした、「カテゴリー論的構成的分散意味論」 Distributional Compositional Categorical Semantics をDisCoCat と呼ぶことがあります。すこしふざけた名前ですが、それは創始者のBob Coeckeのキャラクターだと思います。  Bob Coeckeが始めた「カテゴリー論的構成的分散意味論」は、この10年の間に大きく発展しました。現在では、量子コンピュータを使った自然言語処理 QNLP (Quantum Natural Language Processing) という新しい分野で、活発に研究が続けられている。 「カテゴリー論」+「量子論」が、新しい「言語の意味論」と結びつくのです。これは、とても面白いことだと思います。今回のセミナーでも、こうした流れの一端を紹介できれと思っています。 話は変わりますが、最近話題のchatGPTで少し遊んでいます。いろいろ辛口のコメントもつけているので、丸山は chatGPTにケチばかりつけているという印象を持った人もいるかもしれません。ただ、そうではないんです。 chatGPT すばらしいです。でも、「なぜ」こんなことができるのでしょう? chatGPT ときどきへましたり、ウソをついたりしますね。でも、「なぜ」こんなことが起きるのでしょう? この二つの「なぜ」をかんがえるといろいろ面白いので、数年前につまんなくなって戦線離脱したAIの世界に、再び興味を持ち始めています。その意味では、chatGPTに感謝です。 -------------------------------- 「 カテゴリー論的 構成的分散意味論 Overview 」 を公開しました。 https://youtu.be/xoSOTv3gYNw ?list=PLQIrJ0f9gMcN2nXtvKCK4ApBaVglV8Drx 資料pdf https://drive.google.com/file/d

「呪文」と「魔法使い」 #3 へのコメント

イメージ
【「呪文」と「魔法使い」 #3 へのコメント】 以前投稿した「「呪文」と「魔法使い」 #3」への「暗号技術については、嘘ばっかり。ほとんど全部、間違っている。」という僕のコメントが少し乱暴だったと思い、その理由をコメントとして付け加えました。 この投稿は、僕のblogでも公開しましたので、こちらからも参照できます。 https://maruyama097.blogspot.com/2022/12/3_0750247077.html ポスト量子暗号技術については、少し前のものになりますが、2019年6月のマルレク「暗号技術の現在 -- ポスト量子暗号への移行と量子暗号」を参照ください。 https://www.marulabo.net/docs/cipher/   > ポスト量子暗号とは何ですか? ポスト量子暗号とは、量子コンピュータが現実的に実現されることを前提とした暗号システムのことを指します。ポスト量子暗号は、量子コンピュータが存在するときに使用される予定の暗号システムで、これらの暗号システムは、現在のクラシックな暗号システムが提供するセキュリティレベルを上回ることが期待されます。 ------------------(コメント始まり) そんなに間違ってはいない。 ------------------(コメント終わり) > ポスト量子暗号には、どのような暗号技術があるのでしょう? ポスト量子暗号には、様々な暗号技術が存在します。一つの例として、量子キー配布に基づく暗号技術があります。これは、量子力学を利用して、通信相手間で安全な鍵を配布する技術です。これにより、通信者は、クラシックな暗号技術を使用して、安全に情報を伝送することができます。 また、別の例として、量子ハッキングを防ぐための暗号技術があります。これは、量子力学に基づいた技術で、量子コンピュータを用いて情報を暗号化することで、量子ハッキングから情報を守ることができます。 他にも、複数の量子暗号技術が提案されていますが、現在ではまだ実用化されているものはありません。技術の発展が進むにつれて、より多くの量子暗号技術が登場することが期待されます。 ------------------(コメント始まり) 「ポスト量子暗号」技術を、量子論を利用した「量子暗号」技術と同一視している。 「ポスト量子暗号」

lambek vs. Lambek

イメージ
【 Lambek vs. Lambek 】 Lambek には、彼が作り上げた二種類の文法があります。一つは、前回見た CCG( Combinatory Categorial Grammar)で、もう一つが、今回見る Pregroup Grammarです。 CCGの基本的な型は、文を表すsと名詞を表すnの二つだけでしたが、新しいPregroup 文法では、伝統的な英文法のカテゴリーに準拠して、次のように30数個の基本的な型が用意されています。  π = subject,  π1 = first person singular subject,  π2 = second person singular and any plural personal subject,  π3 = third person singular subject,  πˆ3 = pseudo-subject,  s = declarative sentence, a.k.a. statement,  s1 = statement in present tense,  s2 = statement in past tense,  q = question,  q = yes-or-no question,  q1 = yes-or-no question in present tense,  q2 = yes-or-no question in past tense,  s = indirect statement,  t = indirect question,  σ = direct or indirect sentence,  i = infinitive of intransitive verb,  j = infinitive of complete verb phrase,  j = complete infinitive with to,  ϕ = quasi-sentence with infinitive,  ψ = quasi-sentence with participle,  o = direct object,  o' = indirect object,  oˆ = pseudo-object,  n = name,  n0 = mass noun,  n1