AI・アノテーションにより作成できる「言語資産」

言語資産を作成することで「翻訳コストの削減」、「翻訳品質の安定化」、「生産性向上」が可能です。
また、言語資産を「機械翻訳エンジンのカスタマイズ」や「CMSへのデータ移行」にご利用いただくこともできます。

用語集作成

翻訳メモリ/対訳データ作成

テキスト抽出/ファイル変換

AI・アノテーションとは

任意のデータに対して、関連する情報（メタデータ）を注釈として付与することをアノテーションといいます。翻訳されたコンテンツや資料データから、翻訳コストの削減・翻訳品質の安定化につながる、用途に応じた「使えるデータ」へ変換を行います。

こんな方におすすめのサービスです

紙文書、Webサイトなど、さまざまな形式のデータを使えるデータに変換したい
翻訳コスト削減のために言語資産を作成したいが、予算も限られている
翻訳やポストエディットの工数削減のため、用語集や翻訳メモリを整備したい
機械翻訳エンジンを自社用にカスタマイズして、訳文品質の精度を向上させたい
具体的に何をしたらいいかわからないが、手持ちのデータを有効活用したい

AI・アノテーションのご利用の流れ

元になるデータ　紙文書

元になるデータ　Webサイト

OCR

Webクロール

用語集作成

翻訳メモリ/対訳データ作成

テキスト抽出

ファイル変換

カスタマイズエンジンの作成

DX（デジタルトランスフォーメーション）

用語集の作り方は用途によって違う？

用語集とは、「原文と訳文の用語が対になったデータ」であり、翻訳の際に活用することで専門用語や社内用語の統一ができ、品質を向上させることができます。しかしながら、ひとことに用語集と言っても、用途によってどのように作成すべきかは異なります。

人手の翻訳やポストエディットの場合

翻訳者が用語集を見ながら適用可否を判断できるため、用語に注釈をつけて作成することで、文脈に応じた訳し分けなどが可能となります。

ポストエディット（機械翻訳＋人手の翻訳編集）

機械翻訳の場合

用語集にある用語を機械的に置き換えることになるので、注釈などを不要で、原文と訳語のみのシンプルな形での作成が適しています。

自社で用語集を作成したいという場合

ブラウザ上で簡単安全に機械翻訳・ファイル翻訳ができる、機械翻訳活用ソリューション「XMAT®」の「LAC（Language Asset Creator）」機能を活用することで、誰でも簡単に用語集を作成する事も可能です。

インターネット上の多言語Webサイトから、独自の手法で効率的に対訳データを作成するサービスです。「CorpusNow」もご利用いただけます。

※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。

LAC（Language Asset Creator）機能をマンガで解説

※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。

※上記は一例ですが、川村インターナショナルではお客様の用途に応じた用語集の作成が可能ですので、お気軽にお問い合わせください。

【資料】用語集・翻訳メモリから見るAI・アノテーションの活用方法

QCD（品質・コスト・納期）の向上に繋がるデータを作成する「AI・アノテーション」の活用方法をまとめた資料です。

主な内容はこちら。
・翻訳会社が行うAI・アノテーションとは？
・用語集から見るAI・アノテーションのメリット
・翻訳メモリから見るAI・アノテーションのメリット
問い合わせをする前にまずは資料を。という方はお気軽にご請求ください。

活用事例

多言語マニュアルの翻訳コスト削減のため、翻訳済みマニュアルから翻訳メモリを作成したい

お客様：制御機器メーカー
悩　み：翻訳済みマニュアルの量が膨大なため、従来の方法で翻訳メモリを作成すると期間とコストがかかりすぎる
言　語：日本語-英語、日本語-中国語（簡体字、繫体字）、日本語-韓国語川村インターナショナルが自社開発したツールにより、対訳データを作成。そのデータをもとに当社の経験豊富な担当者が翻訳メモリを作成。

川村インターナショナルが自社開発したツールにより、対訳データを作成。そのデータをもとに当社の経験豊富な担当者が翻訳メモリを作成。

結果

手動で作成する場合と比較して、コスト58%減、納期も3割程度短縮。

お客様の声：他社様と比べた際に、かなり安価で納期も短かったので、安かろう悪かろうだったらどうしようか心配はありました。しかしながら、結果として仕上がりに全く問題なく、大変満足しております。

※価格・納期の削減率は案件により異なります

技術資料の翻訳に機械翻訳を利用しており、ポストエディットの工数を減らしたい

お客様：自動車メーカー
悩　み：汎用的な機械翻訳エンジンの訳文品質がイマイチで、専門用語・社内用語の訳出などに不満がある
言　語：日本語-英語

お客様から提供いただいた翻訳済み技術資料をもとに、川村インターナショナルの豊富な実績と社内の専門エンジニアにより学習データと用語集を作成。そのデータをもとにお客様専用のカスタム翻訳エンジンを生成。

結果

カスタムエンジンのBLEUスコア*は41.4と、汎用エンジンの29.5から大幅に向上。

お客様の声：訳文の修正にかかる工数を平均して15%ほど削減でき、ドキュメントによってはほとんど修正なしで使えるようになりました。非常に大変助かっています。

*BLEUスコア：機械翻訳エンジンの品質を0から100の数値で表したもの。一般に40以上が高品質とされる。

よくある質問

テキスト抽出やファイル変換とは具体的にどのようなサービスですか？

テキスト抽出では、紙原稿やScanデータのテキスト化、また動画や録音データの音声をテキスト化することが可能です。また、ファイル変換では、WordファイルをHTMLやXMLにしたい等、あるデータを別のデータに変換することが可能です。いずれも一部工程を自動化して効率的に処理することで、コストや納期を抑えることができます。

また、ここに記載している以外にもテキスト化したデータをラベリング・分類したり、テキストマイニングしたりと、お客様のニーズに応じたサービスの提供も可能です。翻訳会社のAI・アノテーション活用例集はこちら。詳しくは当社までお問い合わせください。

翻訳メモリとはなんですか？

自社の保有する翻訳されたテキストのデータを、原文と翻訳文を一対としてデータベース化したものです。このデータを再利用することで翻訳にかかる費用を低減することができます。当社では手動で作成する他、ツールを活用して翻訳メモリを作成することも可能です。詳しくはCorpusNowのサービスページをご覧ください。

また、自社で作成したいという場合には、弊社の機械翻訳活用ソリューション「XMAT®」の「LAC（Language Asset Creator）」機能をご利用ください。

対訳データを作成するには、どのくらいの量のテキストデータが必要ですか。

現在主流となっているニューラル機械翻訳では、おおむね1万ペア未満の対訳データを学習させると、訳文の品質が低下することが多いです。ただし、弊社が提供している「みんなの自動翻訳@KI」では、ニューラル機械翻訳と用例ベース機械翻訳のハイブリッドを使用しているため、対訳数が少なくても品質の低下がありません。

AI・アノテーションで作成した言語資産はどのように機械翻訳に活用できるのでしょうか。

対訳データ（コーパス）は機械翻訳エンジンのカスタマイズに使用し、訳調を学習させることができます。用語集は機械翻訳する際に用語を自動的に置き換えることが可能です。

翻訳サービスをお探しの方は、お気軽にご相談ください

ご不明な点はお気軽に
お問い合わせください。

お問い合わせ

商品紹介、ノウハウ集などの資料を
こちらからダウンロードできます。

資料ダウンロード

AI・アノテーションを活用した用語集/翻訳メモリ/データ作成サービス

AI・アノテーションにより作成できる「言語資産」

AI・アノテーションとは

こんな方におすすめのサービスです

AI・アノテーションのご利用の流れ

元になるデータ 紙文書

元になるデータ Webサイト

OCR

Webクロール

用語集 作成

翻訳メモリ/対訳データ 作成

テキスト抽出

ファイル変換

カスタマイズエンジンの作成

DX（デジタルトランスフォーメーション）

用語集の作り方は用途によって違う？

人手の翻訳やポストエディットの場合

機械翻訳の場合

自社で用語集を作成したいという場合

【資料】用語集・翻訳メモリから見るAI・アノテーションの活用方法

活用事例

多言語マニュアルの翻訳コスト削減のため、翻訳済みマニュアルから翻訳メモリを作成したい

技術資料の翻訳に機械翻訳を利用しており、ポストエディットの工数を減らしたい

よくある質問

翻訳サービスをお探しの方は、お気軽にご相談ください

AI・アノテーションを活用した
用語集/翻訳メモリ/データ作成サービス

元になるデータ　紙文書

元になるデータ　Webサイト

用語集作成

翻訳メモリ/対訳データ作成