Agora、開発者が任意のAIモデルに超低遅延の音声機能を追加できる新ソリューションを発表

IoTNEWS編集部

1年前

Agora、開発者が任意のAIモデルに超低遅延の音声機能を追加できる新ソリューションを発表

Agora, Inc.は本日、「Conversational AI Engine（会話型AIエンジン）」を発表した。

このAIエンジンは、カスタムAIモデルや主要な大規模言語モデルプロバイダーのAI、または任意のテキスト音声変換技術を活用できる設計となっており、リアルタイムの会話フローを最適化、発話の途中での割り込みを認識し、スムーズな対話を実現するものだ。

また、環境音を低減してクリアな音声対話を実現する「ノイズ抑制機能」や、AI駆動の音響アルゴリズム、超低遅延の音声認識、Software-Defined Real-Time Networkといった技術が組み込まれている。

主な活用領域は、24時間対応のカスタマーサポートやスマートデバイスの音声操作、バーチャルショッピングアシスタントや企業研修とオンボーディングなどが挙げられている。

「Conversational AI Engine」は現在パブリックベータ版として提供されており、Agoraがサポートする会話型AI構築向けのコミュニティプロジェクト「TEN（The Engager Network）」のフレームワーク上に構築されている。

また今後は、ローコードアプリケーション開発プラットフォーム「App Builder」にも同エンジンを統合予定だ。

AgoraのCEOであるTonyZhao氏は、「ほとんどのAIモデルは、まだ音声でのインタラクションに対応しておらず、対応している場合でも最適化が不十分だ。Agoraの新しいソリューションにより、AIとの会話がよりシームレスで自然なものになる。統合が簡単で、遅延がほぼゼロのリアルタイム音声体験を実現し、企業やユーザの可能性をさらに広げる。」とコメントしている。