アドバンスト・メディア、音声認識API「AmiVoice Cloud Platform」に長時間の音声ファイルに対応したAPIを追加

株式会社アドバンスト・メディアは、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform」をアップデートし「非同期HTTP音声認識API」をリリースした。

AmiVoice Cloud Platformは、クライアントアプリケーションに特別なライブラリを組み込むことなく、容易に音声認識機能をWEBサイトやアプリケーションに実装することができる。

また、様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンが用意されている。また、対面の会議や打ち合わせ、Web会議など、人同士の会話音声に強い会話用のエンジン、音声操作やメール作成など、PCやスマートフォンに対して行う音声入力に適したエンジンなど、利用シーンに合わせてエンジンを選ぶことで認識率が向上する。

今回、これまで提供していたリアルタイム音声認識用の「WebSocket音声認識API」とバッチ音声認識用の「HTTP音声認識API」に加え、新たに非同期HTTP音声認識APIをリリースした。

非同期HTTP音声認識APIでは、HTTP音声認識APIの制限である16Mbytes以上のファイルも一括で音声認識可能になるため、コンタクトセンターの通話音声、会議音声、動画・ラジオ・YouTubeの音声など、長時間の音声データをまとめて文字化することに適している。複数ファイルの非同期処理をまとめて行うため、音声ファイルのサイズや長さに関わらずスピーディーに認識結果を得ることができる。