ポストエディットと人手のみの翻訳の違い~賢い使い分け~
人工知能(AI)を使った機械翻訳、すなわちニューラルネットワーク機械翻訳が登場し、機械翻訳の質は飛躍的に向上しました。このため、機械翻訳を使っただけでも文書の大まかな概要が容易に把握できるようになり、機械翻訳を後編集して訳文を完成させる「ポストエディット」のサービスがこれまでになく有用となっています。
それでは、このポストエディットと、従来の機械翻訳を介さない人手のみの翻訳は、どのように違うのでしょうか。この記事では、ポストエディットと人手のみの翻訳の違いを、それぞれの活用できるシーンに注目してご紹介いたします。
目次[非表示]
ポストエディットの概要
ポストエディット (Post Editing) とは、機械翻訳にかけられた翻訳対象の文章を、専門の作業者が編集を加えることで、訳文として仕上げる作業のことです。以前は機械翻訳の出力結果の品質が良くなかったため、ポストエディットをするくらいなら一から翻訳したほうが早いという場合も多く、あまり一般的な作業ではありませんでした。しかし、機械翻訳の精度向上により、作業者への負担が軽減され、現在では翻訳サービスの一つとして需要が伸びつつあります。
それでは、ポストエディットを導入すると、どのようなメリットがもたらされるのでしょうか。人手のみの翻訳と比較すると、以下のようなメリットを得ることができます。
- 納期が短縮できる
- 人手のみの翻訳よりも安価な場合が多い
いずれも、機械翻訳を利用することにより、人手のみの翻訳よりも作業効率が上がるために可能となっています。それでは、この「作業効率」はポストエディットで具体的にどのくらい向上するのでしょうか?
メリット:ポストエディットの生産性は人手のみの翻訳より高い!
実際にポストエディットの生産性の一例を見てみましょう。
ある研究によりますと、同じ作業者が【日→英】方向の翻訳とポストエディットの作業(英訳)を行った場合、1日の平均の処理量について、それぞれ以下のような結果が確認されています。
- 人手のみの翻訳:3,500~4,000文字/日
- ポストエディット:9,200~9,600文字/日
和訳では若干変わってきますが、上記の結果では、人手のみの翻訳の処理量と比較すると、生産性が2倍以上に上がっていることが分かります。もちろん、翻訳するドキュメントの分野やタイプ、そして使用する機械翻訳エンジンによってこのワークロードは変化します。しかし、機械翻訳が「いい訳文を生成しやすい」ドキュメントを選ぶことができれば、人手のみの翻訳よりも高い生産性が期待されます。
こうしてポストエディットの生産性が上がることによって、より多い分量を短納期かつ低価格で提供できるようになりました。
デメリット:ポストエディットの品質は人手のみの翻訳ほど安定しない
それでは、生産性に対して、ポストエディットの品質は人手のみの翻訳と比較するとどのようなものなのでしょうか。
先ほども少し言及しましたが、実際のところ、機械翻訳+ポストエディットの品質は「どんな文に対してでも安定的に良い翻訳を供給できる」レベルにはまだ達しておらず、一般的に、ポストエディットの品質は人手の翻訳品質より劣るとされています。
これには、以下の理由が挙げられます。
- 機械翻訳の出力結果の品質が一定でない
- いくら人間が編集しても機械翻訳らしい部分が残ってしまう
ポストエディットが機械によって出力された結果をベースに訳文を仕上げる特性を持ち、そのベースとなる機械翻訳の品質が一定でなければ、ポストエディットの負担も変化し、仕上げられる訳文の品質にもムラが出やすくなってしまいます。また、翻訳作業時に機械翻訳によって提供される大まかな訳文が既にあるということは、いくら人間が編集しても機械翻訳らしい部分が残ってしまうということです。これらの要素により、ポストエディットの品質は人手のみの翻訳より劣ってしまうのです。
それでは、ポストエディットの品質を大きく左右してしまう機械翻訳について、その「らしさ」を含め、少しご紹介します。
ポストエディットの品質と生産性を大きく左右する機械翻訳
一般的に、機械翻訳では「直訳調」の訳文が出力されます。これは、機械翻訳エンジンが原文の「文脈」を考慮できないためです。
機械翻訳エンジンは、対訳データベースに基づいて訳文が出力されます。しかし、機械翻訳エンジンは原文の内容や文脈を理解することができないため、文脈に応じた適切な訳語採択を行うことができません。このため、いわゆる「ニュアンスが違う」訳語が使用されてしまったり、文脈を考慮しない原文解釈によって直訳調の訳文、誤訳を含んだ訳文を生成したりしてしまいます。
機械翻訳エンジンの性質を如実に表した誤訳が次の例です。
【原文】
個体維持のため摂食と外界からの刺激からの逃避がまず考えられる。
【機械翻訳文】
For maintaining individuals, it is possible to first consider *escape from eating and stimulation from the outside world.
この機械翻訳出力では、「外界からの刺激」と「摂食」の両方が「逃避」を修飾しているかのように読み取れます(*)。しかし、本来の意図は、(生命が)個体を維持するためには、「摂食」と、「外界の刺激から逃避すること」の2つが必要という意味であるため、正しく訳出されていないと言えます。このように機械翻訳は、字面を置き換えているに過ぎず、言葉の意味を理解した翻訳をしていません。
上記の例のように誤った訳文が出力されると、その句構造、果たしては文構造まで書き換えなければならないことが多く、人の力による修正が求められる部分がまだまだ大きいのが現状です。中には、機械翻訳の出力結果が悪い場合、機械翻訳の利用は参考程度に留めて、ほぼ一から訳文を書き上げることが必要なケースも少なくありません。
このように、機械翻訳の出力結果によってポストエディットの工数と品質は大きく変化することになります。
ポストエディットの向き不向き
それでは、このようなポストエディットの性質を踏まえると、どのような文書がポストエディットに向いているといえるのでしょうか?
ポストエディット向きの文書
ポストエディットの訳文品質が人手のみの翻訳の品質に比べると劣ることを踏まえると、「外部に公開しない文書」=「社内使用文書」が一番向いているといえます。例えば、以下のようなケースです。
- 社内閲覧用のマニュアルを作成したい
- 英文のドキュメントから情報収集をしたい
- 翻訳会社に依頼後、社内で推敲を行う予定
これらのケースは、文書の情報が欠落することなく訳出されていることが優先され、適切なトーンや読みやすさまでは求められませんので、ポストエディットサービスを利用するのに適したシーンだと考えられます。また、機械翻訳が直訳調であるので、硬い文体が求められる文書もポストエディット向きの文書であるといえます。
ポストエディットに向いていない文書
その一方で、ポストエディットに向いていない文書は「外部に公開する文書」です。以下に例をあげています。
- プレスリリース
- ニュースレター
- 製品カタログ
例えば、企業のウェブサイトに掲載するようなものは、ポストエディットの対象として適切とはいい難いです。これは、すでに述べているように機械翻訳が直訳調であり、ポストエディットをした場合でも一から人が翻訳するより品質が落ちるためです。こういったポストエディットの性質があるため、多くの人の目に触れ、かつ自然な日本語であることが求められる外部掲載文書では、ポストエディットをした成果物をそのまま公開することが難しいのが現状です。
ポストエディットの作業効率を上げるコツ
それでは、せっかくここまで記事を読んでくださった皆様に、ポストエディットの作業効率を上げるコツを「ドキュメント選び」の観点からお伝えします。
すでに何度も述べているように、ポストエディットの作業効率はベースとなる機械翻訳の品質によって大きく左右されます。そこで、できるだけ機械翻訳エンジンの出力結果をよくするために、機械翻訳にかける文書に対して、以下の点が満たされているかを意識してみてください。
- インターネットで広く公開されているタイプの文書である
- 完全な文を多く用いている文書である
これらの点を満たすと、適切で正確な訳文が出力されやすくなり、ポストエディットの負荷が下がり、結果として効率よく作業をすることができます。
機械翻訳+ポストエディットによる多言語展開などを当初から想定している文書に対しては、原文執筆の時点から、上記のポイントを意識するのがいいのかもしれませんね。
機械翻訳+ポストエディットのサービスの利用を希望される場合は、ぜひ弊社サービスページをご覧ください。
おわりに
いかがでしたでしょうか。いずれの場合でも、機械翻訳+ポストエディットのサービスには、用途や文書の特徴によって適しているものとそうでないものがあります。
品質/納期/コストなどの要素のうち、どれを優先するべきかによって、一から人間が翻訳する人手のみの翻訳と、ポストエディットを使い分けることが、今後重要になってきそうです。
なお、ポストエディットを特集した記事は過去にも掲載していますので、興味のある方はぜひご一読ください。