生成 AI 活用

ChatGPT/Claude/Geminiなどの生成AIを活用し、既存の翻訳プロセスの自動化・効率化をサポート

生成 AI を活用した翻訳プロセスの自動化・効率化

機械学習やディープラーニング、自然言語処理、画像処理、音声認識
これらの技術を組み合わせることで、翻訳に関するさまざまなタスクを自動化し、効率化することができます。

用語集の作成・適用

文法校正・差分

文書要約・コピーライティング

常体・敬体・スタイル変換

品質評価モデルの構築【研究開発中】
自動ポストエディットモデルの構築【研究開発中】

AI(人工知能)と Generative(生成)AI

AIとは、コンピューターシステムやプログラムが人間の知能や行動を模倣する能力を指します。AIはデータから学習し、問題を解決する能力を持ち、その結果を利用して人が意思決定を行うことを支援してくれます。AIは様々な技術や手法を用いて実現されます。機械学習やディープラーニング、自然言語処理、画像処理、音声認識などがその例です。これらの技術を組み合わせることで、AIはさまざまなタスクを自動化し、効率化することができます。
生成AIは、データから新しいコンテンツを生成するための人工知能(AI)の一種です。

自然言語処理(NLP)、画像生成、音声合成などの分野で活用されます。生成AIは、与えられたデータから学習し、そのパターンや構造を理解し、新しいデータを生成します。

生成AIは、テキスト、画像、音声などの様々なメディア形式を生成することができます。

主な技術手法として、GAN(Generative Adversarial Networks)、VAE(Variational Autoencoder)などがあります。

LLM (大規模言語モデル)と MT(機械翻訳)

大規模言語モデル(LLM)も機械翻訳(MT)も生成 AI の一部といえます。ただし、LLMのほうが対象とするタスクの範囲が広く、機械翻訳以外の要約や固有表現抽出など自然言語処理タスクも実行できることが特徴です。

一方で、翻訳に限定すると、ニューラル機械翻訳(NMT)とLLMの精度を比較してどちらが優れているかは、一概には言えません。特殊な分野に特化していなければ、LLMの翻訳精度はニューラル機械翻訳と同等といえます。しかし、機械翻訳とLLMは異なるアプローチを用いており、それぞれのメリットとデメリットがあります。
LLM(大規模言語モデル)
LLMは、大規模なテキストデータを学習し、言語理解や生成に優れた性能を持つモデルのことを指します。LLMは、自然言語処理のタスクに特化しており、文章の生成、翻訳、要約、質問応答などのタスクを実行することができます。

  • OpenAI社のGPT(Generative Pre-trained Transformer)シリーズ
  • Anthropic社のClaudeシリーズ
  • Google社のGemini
LLMのメリット
  • 文脈を考慮する 
  • 汎用性が高い 
  • ファインチューニング/ゼロショット翻訳の実行ができる 
  • 文体、用語の指定など、翻訳以外の自然言語処理を付加しやすい 
LLMのデメリット
  • 構築・運用コストがとても高い(NMTの1000倍) 
  • 数百万を超すようなテキストの翻訳処理にはとても時間がかかる 
  • デフォルトでは再現性が考慮していない
MT(機械翻訳)
機械翻訳は、言語間のテキストを自動的に翻訳することが目的です。主な技術手法としては、統計的機械翻訳、ニューラル機械翻訳(NMT)などがあります。機械翻訳は、特定の言語間での翻訳を実現するための技術であり、LLMや生成AIの機能の一部としても活用されています。

  • MicrosoftのBing Translator/Google翻訳
  • DeepL
  • みんなの自動翻訳など
MTのメリット
  • 専門特化型のモデルを構築するコストがLLMに比べて圧倒的に安い
  • 同じ原文に対して同じ訳文が繰り返し適用される 

  • 大量のテキストの処理が圧倒的に速い
     

MTのデメリット
  • 用語や文体などの適用が苦手 
  • 文脈を考慮した翻訳が苦手(一文単位の処理)

翻訳の精度に影響を与える要素は多岐にわたります。
状況に応じてNMTとLLMを使い分ける、あるいは併用することが近道です。
翻訳における生成AIの利活用について実績のある当社にご相談ください。

検証中のタスク

【PoC】用語集作成・適用:論文

OpenAI GPT3.5を活用し、物理学の論文から物理用語のみを抽出するファインチューニングモデルを構築して用語集を作成しています。

【PoC】用語集作成・適用:特許明細

OpenAI GPT3.5を活用し、特許明細から化学用語のみを抽出するファインチューニングモデルを構築して用語集を作成しています。

【ベータ版】文法校正・差分

OpenAI GPT4o/Claude3/Gemini1.5を活用し、英語文法の構成モデルを構築し、修正箇所を差分表示するツールを開発しました。

【ベータ版】文書要約・コピーライティング

OpenAI GPT4o/Claude3/Gemini1.5を活用し、日本語あるいは英語の文書を要約あるいはコピーライティングするモデルを構築し、修正箇所を差分表示するツールを開発しました。

【ベータ版】常体・敬体・スタイル変換

OpenAI GPT4o/Claude3/Gemini1.5を活用し、日本語特有の文末表現である常体・敬体を変換する言語変換ツールを開発しました。

【検証中】品質評価モデルの構築

ポストエディット済みデータを基に、OpenAI GPT3.5を活用してポストエディットの必要性を評価するモデルを構築中です。

【検証中】自動ポストエディットモデルの構築

OpenAI 3.5 を活用して誤訳・訳抜けを検知するためのファインチューニングモデルを構築中です。

生成AIを活用した翻訳関連モデルの構築に興味のある方はお気軽にお問い合わせください。

ご不明な点はお気軽に
お問い合わせください。
「翻訳における用語集の利活用」
用語集の利活用に関する特別連載をまとめました。
JSAマーク
ISO17100
JSAT 007

認証範囲:
金融・経済・法務、IT、医療・医薬、電気 ・機械、航空宇宙分野の技術翻訳サービス 及びソフトウェアローカリゼーション (英日、日英)
SGS_ISO-IEC_27001_with_ISMS-AC
※当社では、ISO17100に準拠した翻訳サービスを提供可能です。
準拠サービスをご希望の場合は、ご依頼時にお申し付けください。