AIによる画像認識とは

画像認識とは、静止画や動画などの画像データから、特徴を抽出し、対象となるものが何かを判別し、認識する技術のことである。

人間は、過去の経験知から目で見たものを何か理解し分類することができるが、コンピュータはこれができない。その代わりに、たくさんの画像データから特徴を学習し、新たな画像が何であるかを確率で表示するのだ。

近年では、AIを使った画像認識が注目を集めている。

本記事ではその特徴を紹介する。

AIによる画像認識の歴史

画像認識自体の歴史は古く、1940年代にバーコードの認識が始まりだと言われている。

2012年にディープラーニングが登場してから、AIによる画像認識が一気に普及した。2015年にはAIの画像認識の精度が人間の精度を超えたとされている。

ディープラーニングが登場する以前の画像認識は、用意した画像パターンそれぞれに対し、特徴をひとつずつラベリングする必要があった。

例えば、人間の顔を学習させる時に、ここが目で、ここが鼻だということを膨大な量に対して行っていた。

ディープラーニングの登場後は、その必要がなくなり、利用者は画像パターンを用意するだけで良くなった。

ディープラーニングが大量の画像パターンから、特徴を抽出し、学習モデルを作成する。

製造業の工場では、画像処理による検品や品質保証が行われているが、AIによる画像認識と何が違うのか。

画像処理とは、画像に対して電子的に行う処理のことで、画像変換や変形、特徴量などの情報抽出を行う、画像データに関わる処理全般を指す。

製造業においては、様々な工程で画像処理が活用されており、人間よりも高速かつ正確に判断することができる。

しかし、現状の画像処理は、工程ごとに担当者がトライアンドエラーで精度を向上させており、画像処理を用いる工程が増えるごとに作成や調整に長い時間がかかってしまう。

AIによる画像認識を用いることで、画像データとアルゴリズムさえあれば、似たような判断が必要な箇所は、簡単な追加でAIが自動的に判断をしてくれるようになる。

株式会社豆蔵ホールディングスの事業会社である株式会社オープンストリームとトッパン・フォームズ株式会社は、AIによる画像解析技術を用いて帳票の画像から枠や線、入力項目などの情報を自動認識し、帳票項目を構造化したデータを生成・出力するエンジン「DeepForms（ディープフォームズ）」を共同開発した。

DeepFormsは、トッパンフォームズが保有する帳票データの学習や、オープンストリームが持つ転移学習をはじめとするディープラーニング技術という2社の強みを活かした共同開発を行うことにより、AIを用いた画像解析技術で80％以上の認識率を実現し、顧客の業務に適用可能な精度を実現する。

東芝インフラシステムズ株式会社は、現場作業員の点検・検針・巡回業務にタブレット端末を活用する設備点検支援クラウドサービス「Sharepo（シェアレポ）」のサービスを行ってきた。

そして今回、Sharepoの新オプションメニューとして、AIでメーターの検針値を読み取ることでビル・施設の設備点検・検針業務を軽減し、作業ミスや人手不足解消に貢献する「メーター読取支援サービス」を開始した。

同サービスではタブレット端末のカメラで電気、ガス、水道メーターを撮影するとAIが自動で数値を読み取り、数値とメーターの写真を同時に検針帳票へ記録・集計することができる。

膨大な記事を効率よくチェック！

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

大学卒業後、メーカーに勤務。生産技術職として新規ラインの立ち上げや、工場内のカイゼン業務に携わる。2019年7月に入社し、製造業を中心としたIoTの可能性について探求中。