英語と日本語の差異から見るGoogle翻訳

Google翻訳は、どんな点が改善されたのか?

ちょっと使ってみると、新しいGoogle翻訳が、飛躍的に能力を向上させたのは、感覚的には、明らかに見える。ただ、Google翻訳が実現した「飛躍」が、どのようなものかを正確に述べるのは、意外と難しい。翻訳の評価でよく利用されるBLEU等のスコアは、翻訳改善の重要な目安にはなるのだが、それは、あくまで量的なものだ。質的な「飛躍」は、その数字には、間接的にしか反映していない。

ここでは、英語と日本語の文法の差異に注目して、その差異が、Google翻訳では、どのように埋められているかを、いくつかの具体例で見てみよう。それらは、日本語・英語翻訳の中心的課題であるにもかかわらず、以前の機械翻訳技術では、うまく扱えていなかった。

また、日本語特有の言い回しでも、大きな改善が見られる。

日英文法の違いを考える


最初に、ChomskyのPrincipals and Parameters 理論に従って、日英文法の特徴的な違いを三つほど取り上げよう。

Head-directionality parameter

一つは、日本語・英語の語順に関するものだ。Head-directionality parameter といわれるものだ。

head-initial  English

  • eat an apple
  • a person happy about her work
  • I live in Takasu village.
  • any book
  • We saw that Mary did not swim

head-final  日本語

  • リンゴを食べる
  • 彼女の仕事を喜んでいる
  • 僕が、高須村住んでいる
  • どんな本
  • マリーが泳がなかったのをみた

Null-subject Parameter

二つ目は、Null-subject Parameter といわれるもの。日本語は主語の省略を許すが、英語はそれを許さない。

Null-subject Parameter (+) 日本語
Null-subject Parameter (-) English
  • 私達は買い物をした。後でご飯を食べた。
  • We went shopping. Afterwards, we ate dinner.
  • 今日はゲームの発売日なんだけど、買おうかどうか迷っている。
  • The game comes out today, but I can't decide whether or not to buy it.

Pro-drop Parameter

三つ目は、Pro-drop Parameterといわれるもの。日本語は、代名詞の省略を許すが、英語はそれを許さない。

Pro-drop Parameter (+) 日本語
Pro-drop Parameter (-) English
  • このケーキは美味しい。誰が焼いたの?
  • This cake is tasty. Who baked it?
  • 知らない。気に入った?
  • I don't know. Did you like it?

Google翻訳を他の機械翻訳と比較する


ジョンの昨日のニューヨークでの講義
Lecture by John yesterday in New York (Google翻訳)
In New York yesterday by John's lecture(その他の翻訳)

今日はゲームの発売日なんだけど、買おうかどうか迷っている。
Today is the release date of the game, but I‘m wondering if I should buy it. (Google翻訳) 主語・代名詞を補っている
Wondering whether today is the release date of the game, but I’m buying.(その他の翻訳)

買い物をした。後でご飯を食べた。
I did some shopping. I ate rice later. (Google翻訳)  主語を補う
With the shopping. After eating. (その他の翻訳)

このケーキは美味しい。誰が焼いたの? 
 This cake is tasty. Who baked it? (Google翻訳)  代名詞を補う
 This cake is delicious. Who baked them? (その他の翻訳) これは出来ている

知らない。気に入った?
Do not know. favorite? (Google翻訳)  こちらは訳せていない
Don't know. Into your mind? (その他の翻訳)

日本語の特有の言い回し


日本語には、特有の言い回しがある。そこでも、Google翻訳は、大きな進歩があるように見える。

風邪がひどい
My cold is bad. (Google翻訳)
Terrible cold(その他の翻訳)

私はうなぎ
I am eel (Google翻訳) 
I am an eel(その他の翻訳)

さすがに、これは、見当はずれの直訳である。
ただ、僕が驚いたのは、次の翻訳である。ちゃんと、意味を汲み取っている。

私はうなぎかカツ丼
I like eels or cutlet on rice (Google翻訳)
I am the eel or katsudon(その他の翻訳)

コメント

このブログの人気の投稿

マルレク・ネット「エントロピーと情報理論」公開しました。

初めにことばありき

人間は、善と悪との重ね合わせというモデルの失敗について