製造現場では、作業効率の分析や作業ミスの検知・防止を目的として、カメラ映像から作業員の行動を認識する「行動認識AI」の導入が進んでいる。
「行動認識AI」は大きく分けて、撮影した人物の映像を骨格情報に変換し解析する「骨格認識AI」と、カメラで撮影した動画をそのまま解析する「動画認識AI」がある。
「骨格認識AI」は、少ない計算量で行動を認識できることから導入が進む一方、人物の持ち物が何なのか判別ができず、認識できる行動の種類に制限があった。
また、「動画認識AI」は、持ち物も含めて行動を認識できるが、計算量が膨大で、高性能な計算用のサーバーを必要とするため、運用コストが高くなる課題があった。
こうした中、株式会社東芝は、人物の骨格の動きと1枚の画像を効率的に組み合わせることで、人のさまざまな行動を、少ない計算量で認識できる独自の「ハイブリッド行動認識AI」を開発した。
「ハイブリッド行動認識AI」は、骨格の動きを参考に、独自のAIアルゴリズムを用いて、カメラ映像から行動認識に重要なキーフレームとなる画像を1枚だけ抽出する。
具体的には、行動認識に必要となる度合いを「注目度」という指標で表し、時系列に並ぶフレームの中から「注目度」が高いフレームを選択する。
キーフレームとなる画像のみを利用することで、少ない計算量で、骨格情報には含まれない工具や部品などのビジュアル情報をAIに取り組むことができ、骨格と画像の情報を効率的に計算する行動認識が可能となる。
「ハイブリッド行動認識AI」を公開データセットで評価した結果、「骨格認識AI」のみで認識する手法に比べて、道具を使う行動の認識精度が向上した。例えば、「スマートフォンやタブレットを使用する」という行動では、認識精度が51.6%から89.5%に向上したことが確認された。
これにより、「骨格認識AI」だけでは認識できなかった行動が区別できるようになり、詳細な作業内容や所要時間を実用的な精度で解析することができる。
加えて、動画のフレームをすべて処理する「動画認識AI」と比較して、4.6倍高速に処理することができるため、現場への導入が進んでいる「骨格認識AI」と同様にリアルタイムでの処理が可能とのことだ。
今後は、「ハイブリッド行動認識AI」を、東芝グループの工場や東芝ライテック株式会社の製品であるカメラ付きLED照明「ViewLED」を用いた画像解析ソリューションなどへ活用し、早期の実用化を目指すとしている。
なお、「ハイブリッド行動認識AI」の詳細は、2024年10月27日~30日に開催されるコンピュータビジョンの国際会議「ICIP2024(2024 IEEE International Conference on Image Processing」で発表される予定だ。
[既存技術と「ハイブリッド行動認識AI」の行動認識の比較動画]無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。