TOP >
製造業 > 菱洋エレクトロ、工場や工事現場での音声認識を可能にする「高雑音耐力音声認識システム」を開発
近年、建設工事やインフラ整備などの作業現場では、作業員の業務報告や機器制御において利便性向上を目的とした音声認識の活用ケースが増えている。
しかし、多くの機械が稼働し90dB程度の雑音や騒音が発生する作業現場の場合は通常の会話すら困難となり、一般的な家庭環境(環境ノイズ音圧50dB前後)での使用を想定した従来の音声認識システムでは対応できない。また、多くの音声認識システムはクラウドサービスを利用しており、ネットワーク環境が整っていない作業現場ではシステムを利用できない可能性がある。
菱洋エレクトロ株式会社は、機械が稼働する工場や工事現場などの高雑音(大きな雑音や騒音)が発生する環境下で、95%の認識率を実現する「高雑音耐力音声認識システム」を開発した。
従来の音声認識装置は、一般的な家庭環境での使用を想定して作られているため、ノイズ音圧が発話音圧を上回る環境では認識率が著しく低下するが、同システムでは、発話音圧70dB、環境ノイズ音圧90dBという高雑音の環境下でも、音声認識率95%を達成する。
また、同システムはユーザーが装着するヘッドセットと音声のノイズを抑圧するデバイス、音声を認識するデバイスで構成されており、音声認識エンジンは、基本構成である音響モデル(※1)、言語モデル(※2)、ワード辞書(※3)に加えて、ノイズモデルとそれを用いてノイズを除去する環境ノイズ統合認識機能を搭載しているのが特長だ。
音声認識率特性の比較
同システムを活用することで、高雑音により会話が困難な環境やネットワークが整っていない環境であってもクリアな音声を認識し、円滑なコミュニケーションや作業を実現する。
※1 音響モデル:単語を構成する音と音の繋がりをモデル化したもの。株式会社ATR-Promotions提供の音声コーパスをもとに菱洋エレクトロが開発。
※2 言語モデル:単語と単語の繋がりをモデル化したもの。
※3 ワード辞書:音響モデルと言語モデルを用いて該当する単語を導くもの。
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
AIによって「優秀な人材」の定義が変化したことを、どうみるべきか —AI時代の人材採...
まだ、生成AIのチャットボットで消耗しているの? ー自律的に動くAIエージェントが働...
AI時代の「中間管理職クライシス」 —部下がAIに相談する時代、上司の価値はどこに残...
AIに仕事を頼む技術 —なぜ「営業資料を作って」と頼むと失敗するのか?
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
米政府に公開3日で停止されたAI「Claude Fable 5」、その能力と企業が今...
AIはSaaSを殺さない、「共存戦争」の裏で本当に起きていること
AIが買い物を代行する「エージェント・コマース」時代、Googleが提唱するUniv...
AIエージェントはどこまで使えるか?検証して見えた「二度手間」の課題と正しい距離感
AIエージェント時代到来、OpenAIのワークスペースエージェントを徹底解説、仕組み...
AI活用で営業・マーケティングはここまで変わる、Anthropic公式ユースケースか...
「この施策、成果につながるの?」と聞かれた時の救世主。AIで「施策の根拠」をリアルタ...
予算会議にAIを持ち込んだらどうなるか?Claudeのカスタムビジュアル機能を検証
営業における見込み客の発掘をAIに任せる、Claude Coworkで自動化と生産性...
AIでパワポ生成はどこまでできるか?Claude Cowork×PowerPoint...