アドバンスト・メディア、音声認識APIにディープラーニング技術「Transformer」を実装

株式会社アドバンスト・メディアは、開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」にて提供している、音声認識API「AmiVoice API」のほぼ全ての音声認識エンジンに、ディープラーニング技術「Transformer」を12月13日より実装した。

「Transformer」は、ディープラーニングの発展技術の一つだ。従来の音声認識エンジンAmiVoiceに実装していた、「LSTM(Long Short-Term Memory)」や「Bi-LSTM(Bidirectional Long Short-Term Memory)」というリカレントニューラルネットワーク技術は、過去や未来の情報を記憶という形で取り入れ、現在の情報を計算していた。しかしこの記憶には、離れた時点の情報が残りにくいという課題があった。

これに対し「Transformer」は、過去や未来の各時点の情報を直接、現在の情報に取り入れて計算を行う。そのため、長い入力の離れた時点の情報にも利用でき、高い認識率を実現することが可能だ。

今回、「AmiVoice API」のほぼ全ての音声認識エンジンにこの「Transformer」を実装。「Bi-LSTM」を実装した音声認識エンジンと比較し、リアルタイム認識で最大17%、バッチ認識で最大13%のエラー改善率となった。

「AmiVoice API」の全ラインアップ(同期HTTP音声認識API、非同期HTTP音声認識API、WebSocket音声認識API)で利用可能だ。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録
モバイルバージョンを終了