画像認識AIモデルは、事前に学習させた対象に対しては認識率が高いが、実環境のすべての物体を画像認識AIモデルにあらかじめ学習させることは困難だ。
そのため、実際の利用環境では、AIモデルにとって未知の物体に直面することは避けられない。
一方、AIモデルは「知らない」と判断することが苦手であり、モデルが知っている範囲で無理やり認識することが、予期しない誤動作にもつながりかねないのだという。
例えば、下図の矢印で示す物体(画像左上:ビールケース、画像左下:犬)は、事前に学習していない未知の物体だが、学習済のラベルから無理やり当てはめて推定してしまった結果、そもそも認識できない物体であるはずのビールケースを、一部が車(紺色)で残りが道路(紫)と誤認識し、同様に犬についても一部が木(緑)で一部が道路(紫)と誤認識してしまっている。
特に、車載カメラに搭載されるAIモデルにおいては、「道路」と誤認識してしまうことは重大な事故にも繋がりかねず、未知物体は「未知」と推定できる技術が必要とされる。
こうした中、パナソニック ホールディングス株式会社(以下、パナソニックHD)とPanasonic R&D Company of Americaは、AIモデルが学習していない「本質的に認識ができない」物体を、「未知物体」として認識し、画像認識AIモデルの信頼性を高める技術「FlowEneDet」を開発した。
「FlowEneDet」はフローベースの生成モデルで、画像認識結果が「どれくらい信頼できるのか(不確実性)」を推定可能な生成モデルを、画像認識モデルの後段に追加することで、「未知物体」に付与された誤ラベルを棄却し、本質的に認識が可能な学習済の物体のみを正しく認識できるようにする。
この手法は、学習済の画像認識AIモデルの後段に追加することで拡張でき、高速に動作することが特徴だ。
フローベースの生成モデルは、逆変換可能な関数の合成として複雑な分布を表現できるモデルだ。
学習した物体の分布を正確にモデリングできるため、「学習した既知の物体」と「学習していない未知物体や誤分類(モデリング結果が実際の分布と合わない)」を分離することが可能となる。
さらに、未知物体(OOD)や誤分類(IDM)領域をより高精度に分離するため、データ密度のモデリングを行うエネルギーベースモデルと組み合わせている。
今回開発された「FlowEneDet」を通常のセマンティックセグメンテーションモデルの後段に追加することで、時間のかかるセグメンテーションモデル側の再トレーニングを行うことなく、認識結果の不確実性を推定できるセグメンテーションモデルへと拡張できる。
「FlowEneDet」自体は、エネルギーベースモデルにおける低次元の自由エネルギーを処理するモデルであるため、複雑さの低いアーキテクチャであり、学習・評価コストを大きく増やすことなく、未知物体と誤分類の同時検出を実行する。
また、事前トレーニング済みのセマンティックセグメンテーションモデルの後段に今回開発した「FlowEneDet」を追加し、複数のベンチマークデータセットに対して未知物体や誤分類の認識性能評価を行った結果、従来法を上回る認識結果(※)を達成した。
※:MCD(Monte Carlo Dropout)、SML(Standardized Max Logits)といった従来法と比較し、真陽性率95%のときの誤検出率(FPR95)を20~50%低減した。
ユースケースとしては、AIの信頼性が求められる車載やくらし、B2Bなどが挙げられている。
なお、「FlowEneDet」は、AI・機械学習技術のカンファレンスである「UAI2023(The Conference on Uncertainty in Artificial Intelligence)」に採択され、2023年7月31日から2023年8月4日まで米国ピッツバーグで開催される会議で発表される。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。