NEC、音で起きている状況がわかる「音状況認識技術」を開発

NECは、最先端AI技術群「NEC the WISE」(注1)の1つとして、音により今起きている状況を認識できる「音状況認識技術」を開発した。

音には、障害物や人垣の向こう側など目に見えない状況を認識できる優れた特性があり、従来より、認識対象の音(目的音)に注力した音認識技術の開発が進められてきた。しかし、広い範囲を対象とした際、認識対象以外の音(環境雑音)による目的音の検知感度や認識精度の低下が課題となっていた。

今回開発した「音状況認識技術」は、マイクで収集した音を目的音と環境雑音に分け、目的音から細かい構成音を抽出する構成音抽出技術と、構成音の組み合わせパターンから事象の有無を判別する事象判別技術だ。これにより、判別したいくつかの事象から起きている状況までの認識が可能だという(注2)。

NECは「音状況認識技術」により、公共施設や観光地における犯罪・事故の検知や、高齢者宅の生活音による緩やかな見守りなど様々な環境における危険状況の高精度な認識を実現する。同技術は、音響検知の国際的なコンテストDCASE2016において、雑音中の日常音検知部門(注3)で、第1位を獲得した。また、NECでの検証により、従来比5倍の遠距離でも十分な検知ができることも確認した(注4)。

背景

昨今、安全・安心に向けた取り組みとして、カメラ映像だけでは見えにくい場所でも、音により起きている状況を認識できる技術の開発が進められている。従来の技術は、個々の環境で目的音を大量に学習することで検知を行っていた。しかし、広い範囲から目的音を検知する際、多くの環境雑音が混入するため、遠くで発生した小さな目的音の検知感度が低下したり、目的音を個々の環境ごとに学習させる必要があるなど、未知の環境への導入が難しいといった課題があった。

今回開発した「音状況認識技術」は、マイクで収集した音から未知の環境雑音を分けて環境によらない構成音を高感度に検知し、構成音の組み合わせパターンから事象の有無を高精度に判別することで、これらの課題を解決する技術だという。

新技術の特長

1.小さな音も高感度に検知できる構成音抽出技術
例えば、「ガラスが割れた」という事象で発生する音の場合、「ガシャン」「バリン」「パリン」など、環境によって音が変わる。構成音抽出技術は、マイクで収集した音を、あらかじめ学習していた音の成分は「ガ」や「シャ」、「バ」や「パ」など環境の違いに影響しない細かな構成音に分け、学習させていない未知の音の成分は環境雑音に分けることで、環境雑音の影響を受けることなく、高精度な構成音の抽出を実現した。

2.起きている事象を判別できる事象判別技術
事象判別技術は、環境の違いに影響しない構成音「ガ」や「シャ」、「バ」や「パ」などの組み合わせを事象パターンとしてあらかじめ学習し、構成音抽出技術で高精度に抽出した構成音と照合することで、目的とする事象の有無を判別する。

これらにより、環境雑音が多く存在する広い範囲でも、小さな音を逃さず高感度に検知できるとともに、目的音を環境ごとに学習させる必要がなく、未知の環境への容易な導入が可能だという。

NEC、音で起きている状況がわかる「音状況認識技術」を開発
構成音抽出技術・事象判別技術の概要

(注1)「NEC the WISE」(エヌイーシー ザ ワイズ)は、NECの最先端AI技術群の名称。
(注2)会話の意味までは識別不可。
(注3)IEEE AASP Challenge
Detection and Classification of Acoustic Scenes and Events 2016,
Task2 – Sound event detection in synthetic audio
(注4)従来で4mに相当する検知性能を距離20mで実現し、監視カメラの設置間隔の間をくまなくカバーできる性能をシミュレーションで確認。

Previous

富士通、患者の通院を支援するヘルスケアソリューションを販売開始

パイオニア、クラウド型運行管理サービス「ビークルアシスト」を活用した安全運転管理ソリューション「自動安全コンサルティング」を提供開始

Next