株式会社ヘッドウォータースは、マルチAIプラットフォーム「SyncLect(シンクレクト)」と、自動音声認識を利用した音声ソリューションを、日本マイクロソフトの言語AIモデルを提供するサービス「Azure OpenAI Service」へ連携することで、音声認識とGPTを掛け合わせたサービスをラインナップに追加したことを発表した。
ヘッドウォータースでは以前より、同社の技術と、Microsoft Azureを活用した音声認識、自然言語認識やクラウドコンピューティングを活かしたAIシステムを、企業向けに提供してきた。
また、2015年より、コミュニケーションロボットを活用した「音声対話機能」、2018年からはスマートスピーカーによる「音声UI」に取り組み、「音声によるQ&A」「音声認識とIoT」「音声UIとシステム開発」などの開発を行っている。
今回、自動音声認識でユーザの質問内容をテキスト変換し、「Azure OpenAI Service」に繋げることで、音声認識とGPTを掛け合わせたサービスを、今までよりも早く提供できるようになった。
さらに、「Azure Cognitive Service Speech Service」と「Azure OpenAI Service」、「SyncLect」を連携することで、「音声認識とGPT、音声合成による音声対話」や「音声認識後のGPT活用」を行うAIシステムの提供を行う。
業界の専門用語が数多く出る場面においては、「Azure Custom Voice」を利用することで、業界の専門用語をAzure上でカスタムトレーニングし、「SyncLect」が持つマルチプラットフォーム機能により、任意のWebやアプリから音声認識とGPTを掛け合わせた機能を追加することができる。
入力デバイスとなるマイクも、PCやスマートデバイス、エッジデバイスに接続された任意のマイクが利用でき、モバイル、車載、店頭、オフィス、デジタルサイネージなど、様々なシーンで利用することが可能だ。
また、これまで音声認識を行う場面では、音声をテキスト化する際に、誤ったテキストに変換されてしまうケースが多くあったが、GPTプロンプトチューニングによって、音声認識後に自然言語解析アプローチを取ることで、精度向上を行っている。
今後は、「Microsoft Fabric」や「Microsoft365 Copilot」などに利用されるオフィス社内データの他、「Azure IoT Hub」や「Azure Digital Twins」によって蓄積されるIoTデータを、音声と自然言語によりデータ参照する取り組みを行っていく予定だ。
また、顧客の利用シーンに合わせ、NVIDIAが提供するエッジ音声サービス「NVIDIA Riva」によるGPT音声対話や、OpenAIが提供する「Whisper」のプロンプトチューニング、ファインチューニングによる精度向上などの自動音声認識を進めていくとしている。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。