みらい翻訳、TOEIC900点以上の英作文能力を持つ深層学習による機械翻訳エンジンをNICTと共同開発

株式会社みらい翻訳は、国立研究開発法人情報通信研究機構(NICT)との共同研究のもと、深層学習技術を用いたニューラル機械翻訳エンジン(※1)を開発した。

日・英、双方向のビジネスシーンを想定した書き言葉系翻訳エンジン開発を行い、従来の統計的機械翻訳に比べ翻訳精度が大幅に向上したという。同エンジンの訳質はみらい翻訳のホームページにてデモとして体験可能。また、ニューラル翻訳エンジンを搭載した企業向け翻訳アプリケーションサービスを本年11月から提供し、同社サイト上で申込みの受付けを開始するとしている。

2000年に476万人であった訪日観光客数は2016年に2400万人を超え、2020年には4000万人に達する勢いだ。また、海外企業の買収、多国籍社員の採用、現地マーケティング活動のオンライン化等、世界経済の多極化により企業活動に要求されるグローバル化のレベルは以前よりも増している。一方で、近年の深層学習による機械翻訳技術の進歩は目覚ましく、人手による翻訳に迫る精度が見えてきたという。このような状況から、みらい翻訳では深層学習に基づく機械翻訳エンジンの開発を行ってきた。

みらい翻訳は、NICTとの共同研究のもと、深層学習技術を導入することにより、日・英、双方向のビジネス向け書き言葉系の精度を大幅に向上した翻訳エンジンを開発。特に、ビジネスコミュニケーションや経済系ニュースなどに注力した精度向上を実現しているという。ニューラル翻訳エンジンは、従来型の翻訳エンジン(統計的翻訳エンジン)と比較し、翻訳結果文の情報伝達とともに流暢さが大幅に向上。和文英訳においては、TOEIC900点程度のスコアを持つビジネスマンと同等以上の作文能力があることが確認された。

ニューラル機械翻訳の精度を確認するために下記の2つの方法で調査が行われた。

  1. 比較的短いビジネス英会話の文章を、TOEICスコアをもつ被験者25名と機械翻訳エンジンとでそれぞれ和文英訳をし、その結果を比較することで分析。各レベルのTOEICスコア保有者の訳文と機械翻訳文の優劣が同等となるポイントを調査すると、機械翻訳の結果は900点以上のスコア保有者と同程度であることが判った。
  2. 上記とは別に、TOEICスコア900点保有者に、ビジネスコミュニケーションおよび経済ニュース系の文章で人手による精度評価が行われた。比較対象は以下の通り。
    • 統計的機械翻訳エンジン(従来エンジン)
    • ニューラル機械翻訳エンジン
    • 人手翻訳(TOEIC900点以上の海外赴任が可能なレベルのビジネスマン。翻訳作業においては辞書使用。)

    従来エンジンに対するニューラル機械翻訳エンジンの評価ポイント値の向上幅を確認したところ、情報伝達力は英文和訳・和文英訳の双方向において16%程度向上し、訳文の自然さを評する流暢さは英文和訳において17%程度、和文英訳において32%程度向上した。

    さらに人手翻訳結果とニューラル機械翻訳エンジンの評価ポイント値の比較では、英文和訳においてニューラル機械翻訳エンジンは、人手翻訳に対し10%程度下回るに留まり、また和文英訳においては同等(0.17%向上)となりその実力は人手翻訳に近いことが確認できたという。なお、人手翻訳にかかった時間は、ビジネス会話文100文の英文和訳では平均で7時間程度、和文英訳では2時間半以上となるが、今回のエンジンで翻訳すればこの時間が数秒に縮まることになるという。

みらい翻訳、TOEIC900点以上の英作文能力を持つ深層学習による機械翻訳エンジンをNICTと共同開発

今回開発された書き言葉系翻訳エンジンは、みらい翻訳の企業向け機械翻訳アプリケーションサービスに組み込まれ、実用性の高い機械翻訳ソリューションとして提供していく予定としている。ビジネスコミュニケーションや経済系ニュースだけでなく、企業における翻訳ニーズの高い分野にて翻訳モデルを開発し、高精度かつセキュアな翻訳ソリューションを提供していくという。

(※1)ニューラル機械翻訳エンジンとは、脳の神経回路を模したニューラルネットワークを用いた機械翻訳技術。膨大な対訳データによりニューラルネットワークを機械学習することで、高精度な翻訳を実現する。

【関連リンク】
みらい翻訳(Mirai Translate)
情報通信研究機構(NICT)

Previous

経産省、特許庁の「第四次産業革命」への対応を特集した「特許行政年次報告書2017年版」を発表

アイ・ロボティクス、山岳救助隊にドローン捜索メンバーとして参加

Next