近年、建設工事やインフラ整備などの作業現場では、作業員の業務報告や機器制御において利便性向上を目的とした音声認識の活用ケースが増えている。
しかし、多くの機械が稼働し90dB程度の雑音や騒音が発生する作業現場の場合は通常の会話すら困難となり、一般的な家庭環境(環境ノイズ音圧50dB前後)での使用を想定した従来の音声認識システムでは対応できない。また、多くの音声認識システムはクラウドサービスを利用しており、ネットワーク環境が整っていない作業現場ではシステムを利用できない可能性がある。
菱洋エレクトロ株式会社は、機械が稼働する工場や工事現場などの高雑音(大きな雑音や騒音)が発生する環境下で、95%の認識率を実現する「高雑音耐力音声認識システム」を開発した。
従来の音声認識装置は、一般的な家庭環境での使用を想定して作られているため、ノイズ音圧が発話音圧を上回る環境では認識率が著しく低下するが、同システムでは、発話音圧70dB、環境ノイズ音圧90dBという高雑音の環境下でも、音声認識率95%を達成する。
また、同システムはユーザーが装着するヘッドセットと音声のノイズを抑圧するデバイス、音声を認識するデバイスで構成されており、音声認識エンジンは、基本構成である音響モデル(※1)、言語モデル(※2)、ワード辞書(※3)に加えて、ノイズモデルとそれを用いてノイズを除去する環境ノイズ統合認識機能を搭載しているのが特長だ。
※1 音響モデル:単語を構成する音と音の繋がりをモデル化したもの。株式会社ATR-Promotions提供の音声コーパスをもとに菱洋エレクトロが開発。
※2 言語モデル:単語と単語の繋がりをモデル化したもの。
※3 ワード辞書:音響モデルと言語モデルを用いて該当する単語を導くもの。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。