【特別対談】機械翻訳の現状と展望は?③自然言語処理とオントロジー
半期に1回の特別対談企画。今回お話をお伺いするテプチャイさんは、自然言語処理とオントロジーの専門家。タイの機械翻訳研究の現状と交えながら、専門分野についてお聞きしました。
目次
- タイの最先端研究施設「NECTEC」とアプリ開発
- 東南アジアにおける機械翻訳研究の興りとその難しさ
- 自然言語処理とオントロジー
- ちょっと一息 タイの小話
- ハイブリッド型がアツい!機械翻訳の今後の展望
- ASEAN言語における機械翻訳エンジンの今後
- これから注目すべき機械翻訳エンジンの「分野」~ASEAN諸国を例に~
タイにおける機械翻訳研究の発展
前田:
さて、ここまではNECTECの活動内容と機械翻訳への取り組みについて教えていただきました。ここからは、少しテプチャイさん自身の事についてお話しいただければと思います。
今さらですが、テプチャイさん。日本語めちゃくちゃうまいですね!
それもNMTですか??脳内埋込型のエンジンが完成しているとは…。しかもタイ-日で。
テプチャイ:
なんでやねん!いやいや、タイの大学を卒業した後、7年間、大阪に住んでたんですわ。
前田:
大阪言うたらやっぱあれですか?たこ焼きの修行でしょうか?
テプチャイ:
そうそう、たこ焼きををな、ベースにしたパクチー焼きをタイで広めようと思ってな…ってなんでやねん!そんなもん誰が食べねん!
前田:
いやぁ…さすがですね!(笑)
テプチャイ:
タコ焼き修行じゃなくて…勉強です!タイで大学を卒業した後、日本に留学してました。
もちろん、いきなり学部や大学院にいけるほど日本語ができたわけではないので、まず一年半ほど日本語学校で日本語を勉強して、それから大阪大学で工学部の博士過程に進みました。
今から30年も前になりますが、当時のタイはというと、電気工学、特にコンピューターサイエンスの分野に関しては、あまり研究が進んでなかったのです。それで、最先端の理論や研究を学べる日本での進学を決意したんです。
前田:
なるほど。ということはもうその頃から、テプチャイさんは自然言語処理、そして機械翻訳の可能性を予測してたんですね!
テプチャイ:
もちろん!全部見抜いてましたわ…って言いたいところですが、そこまで考えてたわけではありません。なにせ当時は、携帯電話(スマホ)はおろか、まだパソコンすら手に入れるのが困難な時代でしたから。
「言語の構造を解析して、機械(ソフトウェア)に翻訳させる。」「大量の対訳データ(コーパス)を、機械(ソフトウェア)に学習(ディープラーニング)させて、翻訳精度を向上させる。」なんてことは、まさに夢物語の話でしたよ。
前田:
たしかに、そりゃそうですよね。思えば私も、パソコンを初めて手にしたのは20年前くらいだったと思います。改めて考えると、ここ数年で人類は本当に凄まじい進歩を遂げている気がします。
テプチャイ:
そうですね。特に東南アジアでは、世界的なITの普及と外資の情報インフラの投資により、「工業化」を通り越して「情報化」が進んでいます。
ある意味ではタイもそうですが、これらの国における発展の体感速度は、第二次大戦後に日本が経験した経済発展を遥かに凌ぐスピードだと思います。
機械翻訳とオントロジー
前田:
日本語学校で日本語を習得した後、大阪大学では何を勉強されてたんですか?
テプチャイ:
コンピューターサイエンスですね。大学院ではオントロジー(Ontology)とセマンティックWeb(Semantic Web)を研究しました。
前田:
オントロジーですか。あまり聞きなれない言葉ですが、これはどういう学問なんですか?
テプチャイ:
オントロジーというのは人工知能を研究する際のテーマの一つで、知識を共有したり再利用するための包括的表現の実現を指します。
一般的に、システムやアプリケーションを開発する際には、開発依頼書や要件定義書などの「仕様書」に基づいて、プログラムを構築しますよね?人工知能に知識を与える際にも、様々な「概念」を明示化することが必要なんですが、その時に「こんな感じ」という概念的なアイデアを「こうなんだ」というように「仕様」に落し込む。それがオントロジーの基本的な考え方です。
元は哲学の言葉として使われてましたが、人工知能の研究が進むにつれて、コンピューターサイエンスの分野でも使われるようになったみたいです。
前田:
んー、わかったようなわからないような…。とりあえず、その大学で勉強された「オントロジー」が、現在の機械翻訳の研究のベースになっているわけですね。
博士号を取得した後は、そのまま日本で就職されたんですか?
テプチャイ:
色々とスキップしてますが、端的に言うとまぁそうですね。
大学院を卒業した後は、タイに戻ってNECTECに入りました。日本での就職も考えましたが、やはりせっかく学んだ知識を母国の発展に役立てたいという思いがありましたから。
テプチャイ:
とはいえ、当時、タイではまだAIに関する研究が進んでなかったので、日本で学んだ事を活かせるよう比較的近い分野の研究テーマとして、自然言語処理、そして機械翻訳の研究に進んだのです。日本でオントロジーを学んだといっても、誰も知りませんでしたから(笑)それから5年くらいたって、やっと認知されるようになりました。
前田:
機械翻訳の研究を始めたのは、NECTECに入ってからだったんですね。タイで未発展だった分野について日本で勉強して、それをタイに持って帰って発展させてきたわけですね。まさにこの国における、自然言語処理、機械翻訳研究のパイオニアですね。
テプチャイ:
持ち上げても何もでまへんで!
前田:
(アプリの有料版をゲットしようと思ったのに…。)
ちなみに、テプチャイさんがタイに戻ってから今年で20年くらいになりますでしょうか。NMTが登場したことで、学問としての自然言語処理やディープラーニングが世界的に注目されるようになりましたが、タイではいかがでしょうか?
20年前に比べて、この分野の研究は深化しましたか?
テプチャイ:
そうですね。もちろん昔に比べると圧倒的に研究は進みました。
特に、ここ数年はディープラーニングという手法の確立により、飛躍的に深化したと思います。たくさんの大学で自然言語処理に関する研究室や授業が開かれ、研究者や学生も増えましたね。
そこのターマセット大学でも自然言語処理の研究に力を入れていて、当研究所にもたくさんのインターンシップ生が来ています。
前田:
とある海外のマーケットリサーチの情報によると、自然言語処理の世界市場の予測総額は、2025年には200億ドル~250億ドルにまでなると予想されています。日本はもちろん、中国やアメリカでも広く注目されていますが、やはりタイでもこの分野の研究は伸びているんですね。
優秀な学生(特に日本語ができる人で、機械翻訳の活用やポストプロセスに興味のある人)がいましたら、ぜひ弊社に紹介してください!
テプチャイ:
考えときます!(笑)
<④に続く>