安く抑えるコツ!
機械翻訳+ポストエディット
安く抑えるコツ!
機械翻訳+ポストエディット
人工知能(AI)を使った機械翻訳、すなわちニューラルネットワーク機械翻訳が登場し、機械翻訳の質は飛躍的に向上しました。このため、機械翻訳を使っただけでも文書の大まかな概要が容易に把握できるようになり、機械翻訳を後編集して訳文を完成させる「ポストエディット」のサービスがこれまでになく有用となっています。
この記事では、ポストエディットを利用して安く翻訳を済ませる方法、そしてどのようなシーンでポストエディットが有益であるかをご紹介します。なお、人手翻訳と機械翻訳の違いを説明した記事も用意していますので、ぜひご覧ください。
ポストエディットとは、機械翻訳の出力結果を編集すること(後編集)です。
このポストエディットには以下のメリットがあります。
いずれも、機械翻訳を利用することにより、人で翻訳よりも作業効率が上がるために可能となっています。
さらに、文書の用途や特徴によっては、ポストエディットの価格がさらに安く済む場合もあります。
1つは、文書の用途により求められる品質が異なるため、少ない労力でもある程度の品質が出しやすいポストエディットが用途に合致している場合があります。もう1つは、文書の特徴によって機械翻訳の質が左右されるため、その特徴が機械翻訳の得意な文書の特徴に合致している場合です。こうした場合では、より少ない労力でも比較的高い品質の訳文が作りやすく、ポストエディットのコストはその分低くなります。
それでは、どのような文書が機械翻訳+ポストエディットに適しているのでしょうか。どのような場合にポストエディットサービスの価格が安く抑えられるのでしょうか。文書の用途と文書自体が持つ性質に着目して見てみましょう。
まずはじめに、ポストエディットの対象とする文書は、外部公開しないものがおすすめされます。
例えば、企業のウェブサイトに掲載するようなものは、ポストエディットの対象として適切とはいい難いです。これは、機械翻訳が直訳調であり、ポストエディットをした場合でも一から人が翻訳するより品質が落ちるためです。こういったポストエディットの性質があるため、多くの人の目に触れ、かつ自然な日本語であることが求められる外部掲載文書では、ポストエディットをした成果物をそのまま公開することが難しいのが現状です。
その一方で、ポストエディットの代表的な使用シーンとして挙げられるのが、社内での使用です。具体的には、英文のドキュメントから情報収集ができればよい場合や、翻訳会社に依頼した後に社内で推敲を行うので、最終的な訳文を完成させる前の初稿翻訳を依頼する場合などです。これらのケースは、文書の情報が欠落することなく訳出されていることが優先され、適切なトーンや読みやすさまでは求められませんので、ポストエディットサービスを利用するのに適したシーンだと考えられます。
さて、それでは具体的にどのようなタイプの文書がポストエディットに向いているのでしょうか?
これまでの検証の結果、次のような文書がポストエディットに向いているといえます。
それでは、一つ一つをじっくり見ていきましょう。
インターネットで広く公開されているタイプの文書は、ポストエディットに向いていると言えます。
このような文書は、英語でも日本語でもインターネット上に出回っている情報量が豊富です。インターネットで公開されている情報の量が豊富だと、機械翻訳はそのデータを元に訳文を出力するわけですから、その分適切な訳を出力することができます。
訳が適切だと、ポストエディットをする作業者の負担は必然的に少なくなりますので、ポストエディット自体の価格が安く見積もられるかもしれないのです!
ニューラル機械翻訳は、以前と比べてかなり流暢になりましたが、それでも基本的には直訳調です。機械は言葉を理解しているわけではなく、対訳データから情報を収集して機械翻訳出力を生成しようとします。そのため、翻訳のベースは意訳調ではなく、直訳調であり、もともと直訳調が好まれるタイプの文書が適していると言えます。堅い文体などはその典型例です。
前述の堅い文体の文書に多いのですが、完全な文を多く用いている文書は機械翻訳に適している場合が多いです。ここで完全な文とは、主語、動詞、目的語、助詞など、(日本語の場合)日本語として文法的に省略可能な要素が省略されずに書かれてあるものを言います。
例えば、「(彼は)朝ご飯を食べた」の「彼は」の要素を省略していないことです。ちなみにこの「彼は」を省略すると、機械翻訳は省略された「彼は」を「私は」に置き換えてしまい、「*I had breakfast.(私は朝ごはんを食べた)」のように出力されてしまいかねません。
やはり完全な文だと機械翻訳出力が適切となり、ポストエディットの負荷は少なくて済むのです。
いかがでしたでしょうか。いずれの場合でも、機械翻訳+ポストエディットのサービスには、用途や文書の特徴によって適しているものとそうでないものがあります。
一から人間が翻訳する人手翻訳と、ポストエディットの両方を、シーンに応じて上手く使い分けられるのがコストを安くし、時にはいい品質の翻訳を求めるコツなのかもしれません。