TOP >
人工知能(AI) > アドバンスト・メディア、音声認識APIにディープラーニング技術「Transformer」を実装
株式会社アドバンスト・メディアは、開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」にて提供している、音声認識API「AmiVoice API」のほぼ全ての音声認識エンジンに、ディープラーニング技術「Transformer」を12月13日より実装した。
「Transformer」は、ディープラーニングの発展技術の一つだ。従来の音声認識エンジンAmiVoiceに実装していた、「LSTM(Long Short-Term Memory)」や「Bi-LSTM(Bidirectional Long Short-Term Memory)」というリカレントニューラルネットワーク技術は、過去や未来の情報を記憶という形で取り入れ、現在の情報を計算していた。しかしこの記憶には、離れた時点の情報が残りにくいという課題があった。
これに対し「Transformer」は、過去や未来の各時点の情報を直接、現在の情報に取り入れて計算を行う。そのため、長い入力の離れた時点の情報にも利用でき、高い認識率を実現することが可能だ。
今回、「AmiVoice API」のほぼ全ての音声認識エンジンにこの「Transformer」を実装。「Bi-LSTM」を実装した音声認識エンジンと比較し、リアルタイム認識で最大17%、バッチ認識で最大13%のエラー改善率となった。
「AmiVoice API」の全ラインアップ(同期HTTP音声認識API、非同期HTTP音声認識API、WebSocket音声認識API)で利用可能だ。
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
AIによって「優秀な人材」の定義が変化したことを、どうみるべきか —AI時代の人材採...
まだ、生成AIのチャットボットで消耗しているの? ー自律的に動くAIエージェントが働...
AI時代の「中間管理職クライシス」 —部下がAIに相談する時代、上司の価値はどこに残...
AIに仕事を頼む技術 —なぜ「営業資料を作って」と頼むと失敗するのか?
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
米政府に公開3日で停止されたAI「Claude Fable 5」、その能力と企業が今...
AIはSaaSを殺さない、「共存戦争」の裏で本当に起きていること
AIが買い物を代行する「エージェント・コマース」時代、Googleが提唱するUniv...
AIエージェントはどこまで使えるか?検証して見えた「二度手間」の課題と正しい距離感
AIエージェント時代到来、OpenAIのワークスペースエージェントを徹底解説、仕組み...
AI活用で営業・マーケティングはここまで変わる、Anthropic公式ユースケースか...
「この施策、成果につながるの?」と聞かれた時の救世主。AIで「施策の根拠」をリアルタ...
予算会議にAIを持ち込んだらどうなるか?Claudeのカスタムビジュアル機能を検証
営業における見込み客の発掘をAIに任せる、Claude Coworkで自動化と生産性...
AIでパワポ生成はどこまでできるか?Claude Cowork×PowerPoint...