Localization World 36 Tokyoに登壇しました!
新年度始まってすぐの4月4日(水)~5日(木)に、東京ディズニーリゾートの一角Hilton Tokyo Bayで開催された「Localization World 36」に出席しました。
初日の4月4日(水)には、弊社の自動翻訳ソリューション担当の伊澤がハンガリーから来日したGlobalese開発元のGábor Bessenyei氏と共同で登壇しました。
テーマは、「Customizing NMT Engines - Automated In-domain Adaptation」と題して、今話題のニューラル自動翻訳に関する最先端技術について紹介するとともに、アジアでの自動翻訳事情についても触れました。
*Globaleseは、弊社が日本での独占代理店を勤めるカスタマイズ可能なニューラル機械翻訳エンジンです。
Localization Worldとは?
Localization Worldは、ランゲージサービス業界における世界最大級のイベントです。
毎年、北米・欧州・アジアの三地域で開催され、次回は6月にポーランドのワルシャワで開催される他、今後はアフリカでの開催も予定されています。
世界各国のLSP(ランゲージサービスプロバイダー)や、依頼元企業の担当者とお会いできるのはもちろん、自動翻訳やCATツール(翻訳支援ツール)などの最新情報に触れられるとっても面白いイベントです。
話題のニューラル自動翻訳(NMT)
2016年の9月にGoogle社がニューラル自動翻訳をリリース発表して以来、日本の翻訳業界では自動翻訳に対する関心がかつて無い高まりを見せています。ニューラルネット機械翻訳では、従来の方式と比較して訳文の流暢性が格段に向上し、特にこれまで機械翻訳の活用が難しいと言われていた日英翻訳においても高い品質のアウトプットを得ることが出来るようになりました。
その反面、ニューラル自動翻訳では、ユーザーが用語や表記ルールを指定するといったカスタマイズができないという欠点があります。企業において、自社の製品名や用語、表記スタイルに従うといったことは自動翻訳の質を計る上では重要な要素となり、現在のところいかにニューラル自動翻訳をカスタマイズするかについて様々な研究が行われています。
また、統計ベースの自動翻訳と同様に、ニューラル自動翻訳においてもエンジン構築のためには大量のコーパス(対訳データ)が必要となり、ニューラル自動翻訳エンジン構築のハードルは高いと言わざるを得ません。
In-domain Adaptationという技術は、そんなニューラル自動翻訳の課題を解決する、新たな技術です。
In-domain Adaptation(=分野特化)
In-domain Adaptation とは、「ある特定の分野に特化させる」という意味で、大量の汎用コーパス(分野を特化しない雑多なコーパス)に、比較的少量の特定分野に特化した「コア・コーパス」を組み合わせることにより、エンジンをコア・コーパスの内容に寄せる技術です。
コア・コーパスをいわば「お手本」とし、汎用コーパスの中から有用なデータを選抜することで、少量ながらも選ばれたコーパスによって特定分野において質の高い訳を出力するエンジンを構築します。
これにより、特有の用語や自社のスタイルを維持した翻訳結果の出力が可能になり、コーパスの量が足りず、自社向け自動翻訳エンジンの構築をあきらめていた企業様でも、自社用エンジンを構築できるようになりました。
Google翻訳をはじめとした汎用的自動翻訳エンジンにはないソリューションとして、弊社でも研究を重ねています。
KIの自動翻訳ソリューション
KIではGoogle翻訳などの汎用的自動翻訳エンジンをはじめ、カスタマイズ可能なNMTのGlobaleseなど用途に合わせた自動翻訳の導入支援を提供しています。
In-domain Adaptationに関するコンサルティングも行っておりますので、お気軽にご相談ください。
関連記事
- 〜自動翻訳を活用して翻訳生産性をもっと向上させたい~! 今後の注目ポイントは?
- 【検証】分野・企業に特化した機械翻訳エンジンは作れるのか
- 何がすごい?今流行りのニューラル翻訳とは?
- Localization World 35に登壇しました!