【MT summit XVI 開催間近!】 特別インタビュー企画 ②
「機械翻訳の現状と未来」
目次<続き>
「MT summit XVI @名古屋大学 豊田講堂の見どころ」
ニューラルネット機械翻訳の衝撃とこれからの付き合い方
森口:昨年末くらいにニューラルネット機械翻訳が世に出ました。これについてはいかがですか?
中岩:最初は百度(Baidu)が英中でやったんですけど、やっぱり我々日本人にとってインパクトが大きいのは日本語の関連する翻訳ですから、あまり知られていなかった。
ところが Google が、機械翻訳をニューラルにシフトして、しかも第二リリースの時には日本語が対象言語に入って、日本語を試す機会が増えるとその評判が広がりました。
もともと日本語と英語というのは、機械翻訳業界の中で最も難しい言語対のひとつと言われていて、特に日英は技術的なハードルが高いという共通認識があったと思います。
我々がニューラルネット機械翻訳を身近に感じたのは、性能がいいという論文が出始めた頃で、それでも最初の3年くらいまでは、音声とか画像に比べて自然言語処理っていうのは相性悪いねって言っていたんです。
それがアルゴリズムの改良で良くなって、実際に去年 11 月にニューラルネット機械翻訳が出た時にそれが肌感覚っていうんですかね。実際使ってみると確かにいいよねっていう評価が我々を含めた機械翻訳業界全体に広がりました。
我々よりも、特に利用する一般の方々にとってのインパクトが大きくて、Google というビッグネームから発表されたことがさらに大きな反響につながったんじゃないかなと思います。
もともと我々は調査もしていなかったわけではないんですが、機械翻訳に携わる者としては、ニューラルネット機械翻訳の技術を重視して活動しなきゃいけないなっていうのを再認識しましたね。
森口:我々の翻訳業界も相当なインパクトがあったような気がします。おっしゃったように日本語から英語の機械翻訳は、主語が省略されたり、文章構造自体がだいぶ離れていたりということもあって、英日はまだしも日英っていうのは難しいっていうのが常識だったんです。
それがグーグルのニューラルネット機械翻訳が出てきた時は、最初のインパクトとして
「あ、これはまずい」と思うくらい性能が良かったんです(笑)。
中岩:(笑)
森口:実際にここ半年くらい使ってみたいとおっしゃるお客様も増えてきています。ところが使ってみると、人手翻訳と比較して評価した時にやはりまだこれじゃまだ足りないという感覚がお客様、我々の双方の共通認識です。
それでも人手の翻訳の役に立つ下訳としてのレベルは非常に高くなってきているのでそこをうまく活用したいなというのはありますね。
基本的に昨年 11 月頃の印象と今までの半年くらいの間で、ニューラルネット機械翻訳に対する印象は変わりましたか。
中岩:正直最初はやはり質が変わったという感じがしました。それまで主流だった統計機械翻訳がどうもぎごちないような、張りぼてのような感じの訳になっていて、流暢さ、自然さ、という意味ではかなり落ちる。一方ニューラルは、やはり文章はぱっとみるとまったく自然に感じる。
その後いろんな例文とか、いろんな方が分析されて結果をみていくとやはりニューラルならではの難しいところがあるなというところがわかってきた。
具体的に言うと、どうしてもニューラル翻訳というのは計算機パワーが必要な方式なので、あまり語彙を増やすのは難しい。
対象とする単語を多くしてしまうと、計算力が必要で統計機械翻訳とは数段の桁違いの計算処理が必要になる。そう意味ではある程度しぼらないといけない。そうすると用語がやはりうまく訳されないということが問題として出てきます。
計算機の問題は時代が解決してくれると思いますが、もう一つは、訳の傾向です。統計翻訳の時には基本的には訳の傾向は変わらないんですね。徐々に良くなっていくことはあっても基本的には訳の傾向は大きく変わらないんです。
ところがニューラル翻訳はある種、ノードの活性度というか、数値的なものの変動によってアウトプットを決めるということですから、その初期値、たとえば、最初に入力する書式をどうするかとか、文をちょっと変えただけで訳の傾向がガラッと変わる。
今までの統計機械翻訳では、大体の訳語の傾向は変わらなかったので、たとえばポストエディットに関するノウハウだとか結果の修正方法に関する傾向は変わらなかったんです。
一方、ニューラル翻訳では、微妙な初期値の変化とか、ちょっとした条件の変化とかで変わってしまうだとか、ちょっとだけデータを増やしただけでもガラッと結果が変わってしまう。そういう技術であるとしたときに、データを積み上げながら訳を改善していくというプロセスをどのようにニューラル翻訳に取り入れていくかはもう一つの課題かなと思います。
森口:インプットとしてのアウトプットのぶれ幅みたいな部分が大きいということですよね。
中岩:そうですね。使う側がどういうような環境といいますか、どういうやり方でそういった特徴と付き合っていくかというところに関してまだまだ十分議論できてないかなと思います。
それ以外にもいろいろと技術的なところありますけれども、おそらく使うという観点でみたときにはその 2 つが一番問題かなと思います。