東芝、独自の深層学習手法により一般的なPCで群集の人数をカウントする画像解析AIを開発

世界の防犯カメラの設置数は2022年までに10億台に達するといわれている。今後も加速度的に増加するとみられており、顔認証や人物検知等の画像解析技術を用いた監視ソリューションサービスの提供に加え、駅や空港等の公共施設や商業施設でトラブルの原因となる人の密集状態を迅速に検出し、人数や混雑状況を高精度に計測するニーズが高まっている。また、昨今の新型コロナウイルスの感染拡大を受けて、密集状態を迅速かつ高精度に検知する技術が注目されている。

近年では、AI(深層学習技術)を応用することで、密集度が極めて高い群集の人数の推定が可能になっている。一方で、一般的に深層学習を用いた解析は、データの処理量が膨大でGPUなどの高価な専用演算装置が必要となるため、コストの増加が避けられず幅広い施設への普及が困難である。
東芝、独自の深層学習手法により一般的なPCで群集の人数をカウントする画像解析AIを開発
株式会社東芝は、独自の深層学習手法によって、カメラ画像に映る群集の人数を一般的なPCで計測できる画像解析AIを開発した。

深層学習方式による解析は一般的にGPU(※1)などの専用の演算装置を必要とするが、同技術は一般的なPCに搭載されているCPU(※2)上での高速解析を可能とし、1分間に約180台のカメラ画像を処理することが可能で、大規模施設に設置されている大量の監視カメラを1台のPCで計測することもできる。

また、従来の深層学習手法は、画像に映る人物を同一の推定単位・尺度で解析するため、カメラからの距離によって人物の大きさが変わると正確に検知できず、推定精度が低下していたが、同技術は人物の大きさの変化に対応するため、画像に映る複数のグループが大小どのようなサイズであっても解析できるネットワーク構造にすることで、推定精度の向上を実現した。
東芝、独自の深層学習手法により一般的なPCで群集の人数をカウントする画像解析AIを開発
超高密度な群集を撮影した難易度の高い群集計測のための公開データセットによる評価において、今回開発した手法を適用することで画像1枚当たりの推定人数の誤差が16.0%から14.7%に改善することができた。さらに、同技術は画像の中で混雑している箇所を密度マップとして可視化し、流れの中で人が滞留している箇所や密集箇所を検知することができる。

同技術により、監視カメラの画像から密集状態を検知して通知することで、店舗や公共施設内の状態を把握できるようになり監視の平準化・省力化が図れるほか、滞留する場所を可視化することにより新型コロナウイルスの感染予防における有効な密集防止策としても活用することが期待できる。また、大型施設や複数施設のカメラ映像をクラウド上で一括解析するシステムを少ない計算リソースで運用することができる。

東芝は今後、新型コロナウイルスの感染予防などの応用に向けて同技術を東芝グループの製品およびサービスへ活用することを検討し、2020年度中の製品化を目指す。また、渋滞の解消に向けた車両数解析、在庫管理に向けた箱や商品数解析に対応するなど、解析の対象を拡充するとした。

※1 GPU:Graphics Processing Unitの略で、画像処理に特化した演算装置。
※2 CPU:Central Processing Unitの略で、コンピュータの主要な構成要素の一つ。

Previous

ネクスト・モビリティ、AI活用型オンデマンドバス「のるーと」のオペレーションの仕組みや導入・運営ノウハウの全国展開を開始

FRONTEO、自然言語処理AIエンジン「KIBIT」を活用して児童虐待の予兆を早期に検知するソリューションを提供開始

Next