国立研究開発法人情報通信研究機構(NICT)の先進的音声翻訳研究開発推進センターは、ニューラルネットワーク(深層学習)を用いた機械翻訳の実用技術を開発した。ニューラル機械翻訳(NMT)技術を用いることにより、従来の統計翻訳(SMT)技術に比べ、精度が大幅に向上。本日6月28日から、NICTが開発し、公開している音声翻訳アプリVoiceTra(ボイストラ)に同技術が組み込まれており、精度改善を直接体験できるという。
同件には、総務省の情報通信技術の研究開発 「グローバルコミュニケーション計画の推進-多言語音声翻訳技術の研究開発及び社会実証-Ⅰ.多言語音声翻訳技術の研究開発」における社会実証用コーパスの構築の成果が用いられている。
訪日観光客数は2016年に2400万人を超え、2020年には4000万人に達する勢いになり、多言語音声翻訳へのニーズは日本各地で高まっている。これに応えるために、NICTで開発したVoiceTraの音声翻訳技術の製品化が、既に始まっている。一方で、近年の人工知能(AI)の進展は目覚ましく、ニューラルネットワーク(深層学習)に基づく実用化事例も増え、機械翻訳への適用も活発化し始めた。2013年から、ニューラル機械翻訳(NMT)の基礎研究を推進してきたNICTも、2016年12月にその実用化に着手した。
NICTは、対訳コーパスから自動翻訳の構築にニューラルネットワークを利用した機械翻訳を2013年から研究を開始し、2016年12月から実用化を加速した。実用化には、様々な分野において話し言葉の対話で使われる固有名詞や専門用語辞書の追加が不可欠であり、この手段として「単語とその訳語及びそのクラス(意味分類)」を利用する手法を実装。
翻訳精度(意味が通じる率を翻訳者が評価)を大幅に改善し、多分野(防災、買物、タクシー等)で9割前後の高精度を達成したという。既にニューラルネットワーク化されている音声認識部分に加えて、今回、翻訳のニューラルネットワーク化を実現し、一般公開されている多言語音声翻訳アプリVoiceTraのニューラルネットワーク化を前進させた。
今回は、日英翻訳の双方向のみだが、グローバルコミュニケーション計画の目標とされる全10言語(日本語、英語、中国語、韓国語、タイ語、インドネシア語、ベトナム語、ミャンマー語、スペイン語、フランス語)をカバーできるよう順次拡大を進めていく予定。さらに、積極的な技術移転により、民間での製品化を推進していくという。また、現在、特許等の書き言葉のために翻訳エンジンのニューラルネットワーク化も推進していくとしている。
【関連リンク】
・情報通信研究機構(NICT)
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。