サイトアイコン IoTNEWS AI+

東芝、エッジデバイス上で高速に動作する音声キーワード検出機能付き話者認識AIを開発

東芝、エッジデバイス上で高速に動作する音声キーワード検出機能付き話者認識AIを開発

音声認識技術の市場規模は、2024年には世界で約2兆3千億円になると予想されている。企業等では、業務効率化や人手不足の問題解決として活用が進んでおり、家庭ではユーザーが話しかけるだけで自動的にキーワードを検出して家電等のエッジデバイスの操作につなげる機器が増えている。音声による機器操作は、キーワード検出だけでなく、話者を認識して、話者に合わせて機器の動きを変更する機能も開発されてきており、今後需要が拡大するとみられている。

例えば、エアコンに向けて「エアコンつけて」と発話すると、その音声から話者を認識し、その人に合わせた温度でエアコンを起動するといった機能がある。

キーワード検出と話者認識機能を両立するには、膨大な計算が必要であり、スマートフォンのような高性能な機器か、操作するエッジデバイスをネットワークに接続してクラウド上で計算を行うのが一般的だ。身近にある機器で手軽にこのような機能を使うには、処理能力に制約のあるエッジデバイスの機能(組込みシステム)の中で高速に動作するAIが必要となる。

そこで、株式会社東芝は、処理能力に制約があるエッジデバイス上でも高速に動作する音声キーワード検出機能付き話者認識AIを開発した。同技術を家電に搭載すると、家電がネットワークに接続していなくても、3回の発話で完了する話者登録に加え、音声による操作、話者に合わせて機器の動きを変更することが可能となる。具体的な特徴は以下の通り。

同社は、同技術を実際の組込みシステムに搭載して、家電などのユースケースで実用性の検証を進める。また、東芝コミュニケーションAI「RECAIUS」での活用について、東芝デジタルソリューションズ株式会社と連携して検討を進めるとした。

モバイルバージョンを終了