東芝デジタルソリューションズ、AI-OCR機能搭載の高精度機械翻訳サービス「DOCCAI翻訳」を提供

近年、機械翻訳の精度は大幅に向上しており、ビジネスシーンでの活用ニーズも高まっている。しかし、実際の業務で利用するには、セキュリティや利用環境、業務適応やコストなどの要件を満たす必要がある。

そうした中、東芝デジタルソリューションズ株式会社は、ディープラーニング技術を活用した高精度機械翻訳「DOCCAI翻訳(ドッカイホンヤク)」のサービス提供を、2022年9月1日より開始する。

「DOCCAI翻訳」は、国立研究開発法人情報通信研究機構(以下、NICT)の最新国産機械翻訳エンジンと、東芝グループの機械翻訳のノウハウに、AI-OCRによる文書自動読み取りを組み合わせたサービスだ。

専門用語や表現については、ユーザー辞書登録や翻訳メモリ、追加学習にて対応し、業務分野に特化した翻訳の提供が可能。また、短時間での大量の翻訳(翻訳性能の向上)を行うといったことや、機密文書翻訳でも活用可能なセキュリティの実現など、ニーズに応じたカスタマイズを行う。

情報漏洩のリスクに関しては、翻訳した文書データの一定期間後の自動削除設定や、翻訳履歴(翻訳処理時のテキストログ)の削除を行うことができ、クローズドネットワーク内での利用も可能だ。

AI-OCR機能では、紙文書のスキャンデータや画像データについて、レイアウトを維持したままテキスト化が可能なため、多様な文書を可読性高く多言語に翻訳することができる。

東芝デジタルソリューションズ、AI-OCR機能搭載の高精度機械翻訳サービス「DOCCAI翻訳」を提供
翻訳のサンプル
その他、既存業務システムとの連携なども可能だ。

料金形態は、言語方向数(翻訳エンジン数)による課金で、ユーザー数や翻訳量は無制限だ。

言語は、英語、中国語(繁体字/簡体字)、韓国語、ロシア語、フランス語、イタリア語、ドイツ語、スペイン語、ポルトガル語、ベトナム語、アラビア語の計11か国語(全て日本語との双方向)に対応しており、ファイル形式は、ファイル翻訳(Word・Excel・PowerPoint・PDF・CSV形式・html・テキスト形式)と、AI-OCR(PDF・画像ファイル[.tif、.jpg、.png])に対応している。