memoQトレンドレポート2020 ~ニューラル機械翻訳および翻訳メモリを使用したハイブリッドな翻訳ワークフロー~
※本記事は memoQ の「memoQ Trend Report 2020」を機械翻訳をかけてポストエディット後にリライト処理をしたものです。第二弾として、「Hybrid Translation Workflows with Neural Machine Translation and Translation Memories」をご紹介します。 |
目次[非表示]
ハイブリッドな翻訳ワークフローについて学び、専門知識とNMTエンジンおよびmemoQなどのTMSを組み合わせて、より多くの文章をローカライズしましょう。
ローカリゼーション業界は長年機械翻訳(MT)に注目してきました。言語サービス業界がこれまで直面した中で最も急激な「変化」であるニューラル機械翻訳を活用することについては、実用面で数々の懸念があります。にもかかわらず、多くの専門家が新しい技術革新を語る際に、NMTは間違いなくその一つであると考えています。
NMTは、言語業界に登場した最大のメガトレンドで、ローカリゼーション業界の大ヒットです。メガトレンドと呼ばれるのは、NMTが我々の業界に限定されるわけではなく、基本的な技術であって、永続性があるためです。NMTはビジネス、プロセス、テクノロジー、人材、品質管理、料金の決定、および業界のプロフェッショナル人材の役割など、すべてに影響します。
しかし、NMTは単独では使えません。結局のところ、機械処理されたただの言語です。人間はNMTシステムをトレーニングおよび操作し、スタイル、トーン、およびフィーリングを選択します。NMTを活用するには新しいスキルが必要であり、人間の役割はこれまで以上に重要になります。
技術と人間の相互作用を促進するため、機械とのやりとりを容易にし(ほとんどの場合、最初から新しい翻訳を入力するのではなく、入力済みの文字を編集します)、質の良い過去訳を生かすワークフローと機能が使用されます。
最先端の翻訳環境であるmemoQには、NMTと翻訳メモリ、無数の編集機能、QAツール、および最も快適な作業環境が統合されています。これはすべて、人間と技術の相互作用を最大限に活用するために、機械の背後にいる人間を支援する手助けになります。
NMTと翻訳メモリが密接に連携し、増加し続けている翻訳量をスマートに人間が翻訳できるようにするハイブリッドワークフローが登場します。このワークフローは非常に柔軟で、多様な目的および複数の言語の組み合わせで簡単に翻訳できるようになります。
私たちは、MTは単独で利用されるべきではないと考えています。(大規模なコーパスが存在し、事前に収集されている前提で)MTは多くの言語の翻訳を出力しますが、MTの生の出力結果を編集したり、品質保証することで検証済みの素材として今後も活用できるようにするには、翻訳環境に含まれているその他諸々の機能が重要です。
NMTシステムは、自らの出力を学習および改善できるだけでなく、ハイブリッドプロセスで使用した場合には、スマートで実績のある翻訳テクノロジーの拡張オプションを活用することで、NMTと翻訳テクノロジーの両方の結果を改善することができます。
NMTと翻訳メモリを活用して、これまで以上に高速かつ効率的に翻訳するにはどうすればよいですか?
NMTに関連する2つの課題、「用語」と「文脈」を見てみましょう。
「用語」と「文脈」の両方に対処する解決方法の1つは、Microsoftの機械翻訳プラグインである、Translator Text API v3.0です。このバージョンでは完全にNMTをベースにしており、35以上の言語をサポートしています。機能の1つであるカスタム翻訳を使用すると、用語ベース、翻訳メモリ、およびその他のドキュメントをアップロードすることにより、カスタムNMTモデルを構築およびトレーニングできます。カスタム翻訳はある程度の時間と専門知識が必要な有料のサービスです。これを使用して、プライベートNMTエンジンを作成できます。自分の目的に応じ、自分のリソースでシステムをトレーニングします。第三者がアクセスすることはありません。
用語の課題
人間であろうと機械であろうと、用語は対象の主題に対して適切である必要があります。NMTは、精度を向上させるため、主題に特化した用語集から学習することができます。たとえば、Intento MTゲートウェイプラグインを通じてmemoQでアクセスできるAmazonのNMTサービス(※ memoQ 9.3より直接プラグインできます)では、さまざまなトピック(法律、経済、AV機器など)での自分の用語集をアップロードした後に、memoQプロジェクトで使用することができます。翻訳者は翻訳を開始する前に適切な用語集を選択します。翻訳文中の単語と用語集の用語の一致をシステムが検出すると、翻訳中に適切と思われる用語が採用されます。
文脈の課題
NMT使用時に翻訳の文脈が正しいことを確認するため、翻訳メモリとの一致でNMTを補完することができます。特定の主題に特化した翻訳メモリから一致するソースおよびターゲットセグメントを追加する汎用的なNMTモデル(特定の主題向けにカスタマイズされていない)があるとします。このような場合、MTサービスは指定された文を翻訳し、アップロードされた翻訳メモリの結果に応じて翻訳を変更します。これにより、ユーザーに文脈的に正確な翻訳を提供します。
ハイブリッドソリューションでの人間の役割
最も良い解決策は間違いなく、重要な箇所で人間が関わることです。カスタムモデルを使用し、適切な用語と翻訳メモリの関連セグメントを組み込んだ最高のNMTエンジンでさえ、NMTの結果を編集するには熟練した言語の専門家が必要です。翻訳メモリ、用語ベース、LiveDocsの用例集など、memoQが提案する幅広いリソースを活用することで、ハイブリッドワークフローの中で人間が果たす役割によって、翻訳済みコンテンツを将来自信をもって再利用できるようになります。
短く言うと、1つのワークフローでmemoQのような翻訳支援/コラボレーションツールとNMTエンジンを組み合わせると、より多くの文章をローカライズすることができます。増え続ける海外の顧客へより多くのコンテンツを提供することができるツールで業界の発展を支援することができます。
memoQ とは
(memoQ公式ホームページより)
memoQはCAT(Computer-assisted translation:コンピューター支援翻訳)ツールの一つで、翻訳メモリや用語集を活用することで翻訳作業を効率化できます。
他の翻訳支援ツールと比較すると、memoQには以下のような特徴があります。
|
非常にフレキシブルで、初心者から上級者までレベルを問わず使いやすいCATツールであることが特徴に表れています。
関連記事