【特別対談】機械翻訳の現状と展望は?①タイの専門家に聞いてみた
ニューラルネット(NMT)の登場により、頻繁に耳にするようになった機械翻訳。
従来のルールベース(RBMT)や統計ベース(SMT)に比べると桁違いに品質が向上したと言われていますが、そんなNMTが現状最も「苦手」としている言語が「東南アジア言語」です。
多くの欧州言語で使用されるアルファベット、中国語や日本語で見られる漢字、そして世界共通のアラビア数字など、世界には様々な言語と文字が存在しますが、「東南アジア言語」で使用される文字は、そのいずれとも異なり、構造も極めて特殊です。
中でもタイ語やミャンマー語は、文字の特異性から多くのエンジニアやデザイナーを泣かせてきました。
しかし長年の研究の結果、これら東南アジア言語における、機械翻訳の「可能性」が見られるようになりました。
今回は、日本でも博士号を取得したAIおよびオントロジーの専門家をお招きして、ASEAN諸国における機械翻訳の研究事情と、東南アジア言語における機械翻訳の可能性を伺います。
目次
- タイの最先端研究施設「NECTEC」とアプリ開発
- 東南アジアにおける機械翻訳研究の興りとその難しさ
- 自然言語処理とオントロジー
- ちょっと一息 タイの小話
- ハイブリッド型がアツい!機械翻訳の今後の展望
- ASEAN言語における機械翻訳エンジンの今後
- これから注目すべき機械翻訳エンジンの「分野」~ASEAN諸国を例に~
本日のゲスト Dr. Thepchai Supnithi タイ国立電子コンピューター技術研究センター(NECTEC) Lab Director, Language and Semantic Technology Laboratory 工学博士。 自然言語処理、オントロジー、教育分野におけるAI活用の研究に従事。 |
前田:
Thepchai さん(以下「テプチャイ」)、お時間をいただきありがとうございます。
今日はどうぞよろしくお願いいたします。
テプチャイ:
こちらこそ遠いところをわざわざありがとうございます。暑かったでしょ?
前田:
いやぁ暑い!香港と同じように湿気が多いかなと思ってましたが、陽射しが強くてジリジリきますね!
テプチャイ:
そうですね。普段はもうちょっと湿気が多い日もあるんですが、昨日今日は特に暑いですよ。でもそう思ってたら、急に雨が降ってきたりするんで、折り畳み傘は必須です。
前田:
実は昨日それでやられて靴がぐしょぐしょになりました。まだちょっと冷たいんですよ…。(涙)
すごく小型の折り畳み傘が人気だと聞きましたが、その理由がわかりました。ぼくの靴が乾くのを待っていてもしょうがないので…。早速はじめさせて下さい!
よろしくお願いいたします。
テプチャイ:
なぁに、すぐに乾きますよ。よろしくお願いいたします。
タイの最先端研究施設「NECTEC」の概要
前田:
まず初めにテプチャイさんが所属している、この「NECTEC」という組織について教えていただけますでしょうか?
テプチャイ:
NECTECとは、タイ政府の科学技術省(Ministry of Science and Technology)が運営している国立の研究機関で、正式名称は「The National Electronics and Computer Technology Center」(タイ国立電子コンピューター技術研究センター)と言います。日本でいうところのNICT(情報通信研究機構)みたいなところでしょうか。
主に、Computer Science(コンピューターサイエンス)やAI(人工知能)、Electronics(電気工学)に関する技術開発や研究を行っています。すぐそこにあるタマサート大学をはじめ、さまざまな大学や企業、海外の研究機関とも連携しています。タイ全国でもトップクラスの研究者が集まる最先端の研究施設です。
(NECTEC公式ホームページ より)
前田:
この広大な敷地を見て、なんとなくそんな感じがしました。入口から建物に到着するまで、車で5分くらいかかりましたもん。アメリカにある某IT企業の「キャンパス」並みの広さですね。何人くらいの人が働いているんですか?
テプチャイ:
公式Webサイトによると582人らしいですね。たしかに広すぎて、研究者や学生も慣れるまでは結構迷いますね。
前田:
それだけ大きいと、やっぱりたくさんの部門があるんですかね?
テプチャイ:
んー、大きく分けて次の4つの部門と、その部門からさらに15のセクションにわかれています。
私が所属しているのは、Research and Development(研究開発)部門のLSTというセクションで、主にAI(人工知能)と、Language(言語)、そして語義解析に関する研究を行っています。
具体的には、タイ語における自然言語処理や、Ontology(オントロジー)を活用した研究などが挙げられます。
前田:
まさに研究所って感じですね!わかったようでわからない感は否めませんが、とりあえず最先端の研究所であることはわかりました!
テプチャイ:
すいません、ちょっとわかりにくかったかもしれませんね。
もっと実務レベルで言うと、機械翻訳エンジンの構築や多言語コーパスの作成、そしてスマートフォン用のアプリ開発なども行っています。
前田:
なるほど!今回は100%理解しました。
ニーズに応じたアプリ開発:タイのローカルグルメを求めて
前田:
ちなみに、スマートフォン用のアプリというのは、どのようなものですか?
まさか課金制のゲームアプリではないでしょうね…。
テプチャイ:
違いますよ!!(笑)
屋台メシや郷土料理など、タイのローカルグルメを複数言語で紹介する辞書アプリです。ここからダウンロードできるので、よろしければお試しください。
(App Store より)
前田:
では早速…。(ダウンロード中…完了!!)
あれ、UI(ユーザーインタフェース)が全部タイ語ですよ?
テプチャイ:
それはフリー版ですね。ローカライズ版がほしければ、こちらの有償版をどうぞ!
前田:(360円…。)
とりあえずフリー版で試してみますが…あ!すごい!フリー版でもちゃんと音声が適用されてますね。
いつもは身振り手振りでなんとか乗り切ってますが、これがあれば食事の際のコミュニケーションがずいぶん楽になると思います。
なによりも、その料理に何が入ってて、どういうものなのかがわかるのが、とてもありがたいです。
テプチャイ:
ということは、いつもは何かわからないで食べてるんですね?(笑)
前田:
まぁ、そういうこともありますね。
このアプリ、翻訳テキストだけでなく音声で発話されるのがとてもいいですね。
実際に屋台とかで注文する時、お店の人にスマホの画面やガイドブックの単語帳を見てもらうって、なかなか難しいんですよね。文字が小さかったりして見えづらいし。
テプチャイ:
そう、タイでは屋台文化が根強く残っていて、水上マーケットや地元の野外食堂での食事は観光客に人気のあるアクティビティの一つです。
しかし、そういう場所では英語が通じないことが多く、食べたいものが食べらないことも少なくありません。
前田:
ああ、まさにその通り。すごくよくわかります。
テプチャイ:
そうした問題の解決に少しでも役立てればと思って開発したのが、このアプリです。
ぜひ前田さんもこのアプリを使って、タイの美味しいものを満喫してください。トムヤムクンやパッタイだけでなく、イサーン料理や南部の地方料理なんかも美味しいですよ!
(タイの鍋料理、タイスキ)
前田:
ありがとうございます。今日の晩御飯を調達する際に、活用させていただきます!
<②に続く>