NTT Comなど、製薬業界向けAI翻訳の精度を向上させる「製薬カスタムモデル共同開発」の参加メンバーを募集

製薬業界では、治験薬概要書や治験実施計画書などの膨大な文書を翻訳する必要があり、その稼働の軽減が課題となっている。昨今は、AIによる自動翻訳が可能になったが、これらの文書は難解な専門用語や複雑な文章を含んでいるため、実用的な精度での翻訳は容易ではない。

AI翻訳の精度を高めるためには、機械学習用に収集するコーパス(※1)の数を増やすことが重要である。1社で収集できるコーパスの数は限られているが、複数の企業でコーパスを持ち寄ることで、大きな精度向上が期待できる。

そこで、NTTコミュニケーションズ株式会社(以下、NTT Com)、株式会社みらい翻訳、株式会社翻訳センターは、3社が主催する「製薬カスタムモデル共同開発」で、第二期製薬企業メンバーの公募を本日から開始した。参加メンバーは、NTT ComのAI翻訳プラットフォームサービス「COTOHA Translator」上で、製薬関連文書の翻訳に特化した自動翻訳を利用することができる。対応言語は、日本語から英語、および英語から日本語への翻訳だ。

第一期メンバーである12社から収集したコーパスに、第二期で収集するコーパスを追加拡充して、さらなる精度向上を図る。なお、各社のコーパスは、機密が保たれるように運用し、参加メンバー間でのみの利用となる。

各主催企業の役割は以下の通り。

  • NTT Com
    COTOHA Translator製薬カスタムモデルサービス提供、参加希望各社に対するフォローアップ
  • みらい翻訳
    機械翻訳エンジン(※2)を含むアプリケーション開発、製薬カスタムモデル開発
  • 翻訳センター
    翻訳プロフェッショナルサービスの提供、コーパスアライメント業務および翻訳品質評価

※1 自然言語の文章を体系的に収集した大規模なデータベースのこと。とくに自然言語処理では、構造化され、付加的な情報とともに集積されたものを指す。
※2 みらい翻訳の機械翻訳エンジンの一部は、国立研究開発法人情報通信研究機構の研究成果を利用して、みらい翻訳にて製品化したもの。

Previous

NVIDIA、対話型AIアプリケーションを実現する推論ソフトウェア開発キット「NVIDIA TensorRT 7」を発表

ストックホルムの電動キックボードで感じた、IoT成功に大事なこと

Next