内田洋行 FOODs IT Fair 2024 - 食品業界のデータとAI活用の最前線

菱洋エレクトロ、工場や工事現場での音声認識を可能にする「高雑音耐力音声認識システム」を開発

近年、建設工事やインフラ整備などの作業現場では、作業員の業務報告や機器制御において利便性向上を目的とした音声認識の活用ケースが増えている。

しかし、多くの機械が稼働し90dB程度の雑音や騒音が発生する作業現場の場合は通常の会話すら困難となり、一般的な家庭環境(環境ノイズ音圧50dB前後)での使用を想定した従来の音声認識システムでは対応できない。また、多くの音声認識システムはクラウドサービスを利用しており、ネットワーク環境が整っていない作業現場ではシステムを利用できない可能性がある。

菱洋エレクトロ株式会社は、機械が稼働する工場や工事現場などの高雑音(大きな雑音や騒音)が発生する環境下で、95%の認識率を実現する「高雑音耐力音声認識システム」を開発した。

従来の音声認識装置は、一般的な家庭環境での使用を想定して作られているため、ノイズ音圧が発話音圧を上回る環境では認識率が著しく低下するが、同システムでは、発話音圧70dB、環境ノイズ音圧90dBという高雑音の環境下でも、音声認識率95%を達成する。

また、同システムはユーザーが装着するヘッドセットと音声のノイズを抑圧するデバイス、音声を認識するデバイスで構成されており、音声認識エンジンは、基本構成である音響モデル(※1)、言語モデル(※2)、ワード辞書(※3)に加えて、ノイズモデルとそれを用いてノイズを除去する環境ノイズ統合認識機能を搭載しているのが特長だ。

菱洋エレクトロ、工場や工事現場での音声認識を可能にする「高雑音耐力音声認識システム」を開発
音声認識率特性の比較
同システムを活用することで、高雑音により会話が困難な環境やネットワークが整っていない環境であってもクリアな音声を認識し、円滑なコミュニケーションや作業を実現する。

※1 音響モデル:単語を構成する音と音の繋がりをモデル化したもの。株式会社ATR-Promotions提供の音声コーパスをもとに菱洋エレクトロが開発。
※2 言語モデル:単語と単語の繋がりをモデル化したもの。
※3 ワード辞書:音響モデルと言語モデルを用いて該当する単語を導くもの。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録