一般的に、高精度な画像解析AIを構築するには、数万枚以上の大量の実画像データでAIを学習させる必要があるが、実利用の場面においては 、特殊な環境下または専用の装置で撮影する画像は、撮影に時間やコストを要するため、入手できる画像が小規模となる傾向にある。
特に、半導体製品の開発工程で用いられるウェハ画像や、生体画像のような倫理やプライバシーの観点から、二次利用ができないデータなどでは、大量の画像データを収集するのは困難だ。
さらに、新規検査の立ち上げや開発工程における一時的な検査においては、画像データが小規模の段階で解析して詳細の解析が必要かどうかを判断し、短期間で開発にフィードバックしたいといったニーズがある。
AI開発においては、少量の画像データしか用意できない場合には、解析したい画像と特性の近い画像からなる大規模なデータセットを用いて、画像の特徴をAIに事前に学習させることで、解析精度を向上させる「事前学習」が有効だ。
「事前学習」においては、動植物や乗り物といった被写体を一般的なカメラで撮影した画像(以下、自然画像)からなる大規模自然画像データセットを用いて「事前学習」する方法が一般的だが、製造現場や医療現場などで専用の装置で撮影された産業画像(以下、非自然画像)は、自然画像とは画像の特徴が異なるため、十分な精度が得られないという課題があった。
そこで株式会社東芝は、「画像解析AI」において、事前学習に必要な学習データが十分に得られない顕微鏡画像や赤外線画像、生体画像といった特殊な装置や環境下で撮影した産業用途の非自然画像でも、少数の実画像データから学習データを自動生成し、解析できる画像解析AIを開発した。
このAIは、独自の事前学習方式を特長とし、従来画像解析AIの活用が難しかった産業分野での適用が可能になる。
考案した「事前学習」技術は、一般的なカメラで撮影した自然画像ではなく、専用の装置で撮影された産業用途の非自然画像(対象画像)を事前学習用のデータとして用る。
対象画像の一部を切り出した画像を複数組み合わせ、その各画像をランダムに回転・反転させ1枚の画像として結合したものから、再度部分的に画像を切り出すことで、似たような特徴を持つ画像を生成する。
こうして生成した画像を学習データとして事前学習させることで、自然画像を用いる場合とは異なり、解析対象の画像と類似の画像を用いた学習を実現し、画像解析AIの精度を向上させることができる。
また東芝は、このAIの精度について、公開されている5種類の非自然画像データセットで評価をした。
具体的には、インターネット上で公開されている赤外線画像・顕微鏡画像・ウェハ画像・病理画像・眼底画像の5種類の非自然画像データセットから、それぞれランダムに40~1,000枚の少量の実画像データを選択し、AIの効果を検証した。
学習データ画像の枚数を、数十倍から数百倍になるまで自動生成して事前学習したAIで画像を解析したところ、130万枚の実画像の学習データを持つ代表的な大規模自然画像データセットを用いて事前学習した場合を上回る精度で、対象画像を識別することに成功した。
一般的に、高精度な画像解析の実現には数万枚以上の大量の実画像データが必要だが、今回のAIは最小40枚という少数の実画像データで解析を実現した。
なお東芝は、この技術の詳細を、2024年12月8日から12日にベトナムで開催された「国際会議ACCV2024(17th Asian Conference on Computer Vision)」にて発表したとのことだ。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。