インターネット上の多言語Webサイトから、独自の手法で効率的に対訳データを作成するサービスです。「CorpusNow」もご利用いただけます。
※株式会社川村インターナショナルのソリューション提供サイトへ外部リンクします。
お客様の声:他社様と比べた際に、かなり安価で納期も短かったので、安かろう悪かろうだったらどうしようか心配はありました。しかしながら、結果として仕上がりに全く問題なく、大変満足しております。 |
お客様の声:訳文の修正にかかる工数を平均して15%ほど削減でき、ドキュメントによってはほとんど修正なしで使えるようになりました。非常に大変助かっています。 |
テキスト抽出やファイル変換とは具体的にどのようなサービスですか?
テキスト抽出では、紙原稿やScanデータのテキスト化、また動画や録音データの音声をテキスト化することが可能です。また、ファイル変換では、WordファイルをHTMLやXMLにしたい等、あるデータを別のデータに変換することが可能です。いずれも一部工程を自動化して効率的に処理することで、コストや納期を抑えることができます。
また、ここに記載している以外にもテキスト化したデータをラベリング・分類したり、テキストマイニングしたりと、お客様のニーズに応じたサービスの提供も可能です。翻訳会社のAI・アノテーション 活用例集はこちら。詳しくは当社までお問い合わせください。
翻訳メモリとはなんですか?
自社の保有する翻訳されたテキストのデータを、原文と翻訳文を一対としてデータベース化したものです。このデータを再利用することで翻訳にかかる費用を低減することができます。当社では手動で作成する他、ツールを活用して翻訳メモリを作成することも可能です。詳しくはCorpusNowのサービスページをご覧ください。
また、自社で作成したいという場合には、弊社の機械翻訳活用ソリューション「XMAT®」の「LAC(Language Asset Creator)」機能をご利用ください。
対訳データを作成するには、どのくらいの量のテキストデータが必要ですか。
現在主流となっているニューラル機械翻訳では、おおむね1万ペア未満の対訳データを学習させると、訳文の品質が低下することが多いです。ただし、弊社が提供している「みんなの自動翻訳@KI」では、ニューラル機械翻訳と用例ベース機械翻訳のハイブリッドを使用しているため、対訳数が少なくても品質の低下がありません。
AI・アノテーションで作成した言語資産はどのように機械翻訳に活用できるのでしょうか。
対訳データ(コーパス)は機械翻訳エンジンのカスタマイズに使用し、訳調を学習させることができます。用語集は機械翻訳する際に用語を自動的に置き換えることが可能です。