何がすごい?精度は?今流行りのニューラル機械翻訳(NMT)とは?
何がすごい?精度は?今流行りのニューラル機械翻訳とは?
翻訳精度が飛躍的に向上したという噂のGoogle翻訳。Google翻訳は別名ニューラル翻訳(NMT)ともいわれ、これからの機械翻訳を牽引していく存在になることが期待されています。ニューラル翻訳とは何かについてみていきましょう。
人の脳神経細胞に似た仕組み!ニューラルネットワークはAIだった
ニューラル翻訳はニューラルネットワークを活用した翻訳で、人の脳神経細胞の活動を単純化したモデルを採用しています。機械に人間が記憶するときの活動をシミュレーションさせることで、人工知能(AI)を作成させる技術です。一つの物事を段階を踏みながら分析するので、ディープラーニングとも呼ばれています。
ニューラルネットワークの研究は50年ほど前から行われていましたが、精度の高い結果を得るには大量のデータの蓄積が必要で、当時はまだデータ量もコンピューターの性能も十分ではありませんでした。webの時代に入り、この問題点は一気に解消されることになりました。
特にデータ量の蓄積がものをいうニューラルネットワークでは、大量のデータを収集できるGoogleは非常に有利な立場にあります。優秀な人材が世界各国から集まっていることも大きなアドバンテージになっています。
ニューラルネットワークを実用化したものの一つが、スパムメールの判別です。
これまでスパムメールの判別には、スパムの条件を人が与えるなど、人の手が大きく介在していました。ニューラルネットワークを活用したスパムの判別では、スパムメールの特徴を大量のデータの中からコンピューターが学習してくれるので、人はその仕訳が合っているかどうかをチェックするだけになりました。結果、スパムの判別は99.9%の精度で行えるようになっています。
ニューラル翻訳は実用レベルに!画像翻訳も可能
Googleが提供しているGoogle Photoもニューラルネットワークを活用した機械学習の成果の一つです。画像の中から被写体が何かを判別することができるようになっています。人や動物、海や空などを判別しそれぞれをカテゴライズしてアルバムを自動で作成するサービスも提供しています。
これを翻訳に活用したのがニューラル翻訳。ニューラル翻訳はこれまで難しいと言われていた画像の翻訳も可能になっています。また、従来はパーツごとだった翻訳が、ニューラル翻訳では文章単位で訳の候補を見つけることができるようになりました。言葉の順番を調整できるようになったので、人に近いフレキシブルな翻訳が実現しています。
2016年11月にGoogleは、ニューラル翻訳の対象言語を英語、フランス語、ドイツ語、スペイン語、ポルトガル語、中国語、韓国語、日本語、トルコ語の8か国語に拡大しました。この8か国語は世界人口の3分の1が話す言葉に相当すると言われ、どんどん活用できるレベルになっています。
web時代の到来で、企業もニューラル翻訳を活用した機械翻訳を導入せざるを得ない状況になりつつあります。翻訳対象が広がったことで、大量のドキュメントを短納期で仕上げなければならなくなっているからです。
ニューラル翻訳があれば人の翻訳は要らなくなるか
機械翻訳を活用すれば、これまで100%人の手で翻訳していたものの割合を、半減あるいはそれ以下に抑えることが可能です。機械翻訳によって、翻訳者は不要になるのではという議論も活発になってきています。
しかし、今すぐ全面的に機械翻訳に切り替えるのは難しいでしょう。なぜなら、ニューラル翻訳は実用レベルになっているとは言っても、まだまだ日本語の対訳データの量は英語などに比べると少なく、翻訳の後作業であるポストエディットが欠かせないからです。
ある言語を多言語に置き換える作業は機械翻訳に任せることは可能ですが、文化が異なっても誤解のない表現にするには人の手が欠かせません。ポストエディットの作業は増える可能性があります。
これによって今まで翻訳できていなかったコンテンツが翻訳できるようになったり、機械翻訳に下訳を任せて、人は別の仕事をするということができるかもしれません。機械翻訳とうまく付き合えば、より多くの仕事をすることも可能になってくるでしょう。
川村インターナショナルでは20年以上前から機械翻訳の活用を試行錯誤してきました。機械翻訳を比較ご検討中の方には、選定時の重要なポイント・CATツールとの連動・スペック比較を含めて、自社の要件に合わせた機械翻訳エンジンをご提案させていただきます。ぜひご相談ください。
関連記事