内田洋行 FOODs IT Fair 2024 - 食品業界のデータとAI活用の最前線

ヘッドウォータース、「Azure OpenAI Service」と音声による企業向けGPTサービスを追加

株式会社ヘッドウォータースは、マルチAIプラットフォーム「SyncLect(シンクレクト)」と、自動音声認識を利用した音声ソリューションを、日本マイクロソフトの言語AIモデルを提供するサービス「Azure OpenAI Service」へ連携することで、音声認識とGPTを掛け合わせたサービスをラインナップに追加したことを発表した。

ヘッドウォータースでは以前より、同社の技術と、Microsoft Azureを活用した音声認識、自然言語認識やクラウドコンピューティングを活かしたAIシステムを、企業向けに提供してきた。

また、2015年より、コミュニケーションロボットを活用した「音声対話機能」、2018年からはスマートスピーカーによる「音声UI」に取り組み、「音声によるQ&A」「音声認識とIoT」「音声UIとシステム開発」などの開発を行っている。

今回、自動音声認識でユーザの質問内容をテキスト変換し、「Azure OpenAI Service」に繋げることで、音声認識とGPTを掛け合わせたサービスを、今までよりも早く提供できるようになった。

さらに、「Azure Cognitive Service Speech Service」と「Azure OpenAI Service」、「SyncLect」を連携することで、「音声認識とGPT、音声合成による音声対話」や「音声認識後のGPT活用」を行うAIシステムの提供を行う。

業界の専門用語が数多く出る場面においては、「Azure Custom Voice」を利用することで、業界の専門用語をAzure上でカスタムトレーニングし、「SyncLect」が持つマルチプラットフォーム機能により、任意のWebやアプリから音声認識とGPTを掛け合わせた機能を追加することができる。

入力デバイスとなるマイクも、PCやスマートデバイス、エッジデバイスに接続された任意のマイクが利用でき、モバイル、車載、店頭、オフィス、デジタルサイネージなど、様々なシーンで利用することが可能だ。

また、これまで音声認識を行う場面では、音声をテキスト化する際に、誤ったテキストに変換されてしまうケースが多くあったが、GPTプロンプトチューニングによって、音声認識後に自然言語解析アプローチを取ることで、精度向上を行っている。

今後は、「Microsoft Fabric」や「Microsoft365 Copilot」などに利用されるオフィス社内データの他、「Azure IoT Hub」や「Azure Digital Twins」によって蓄積されるIoTデータを、音声と自然言語によりデータ参照する取り組みを行っていく予定だ。

また、顧客の利用シーンに合わせ、NVIDIAが提供するエッジ音声サービス「NVIDIA Riva」によるGPT音声対話や、OpenAIが提供する「Whisper」のプロンプトチューニング、ファインチューニングによる精度向上などの自動音声認識を進めていくとしている。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録