株式会社KDDI総合研究所は、あらゆる顔の向きでも高精度に表情を分析する「表情認識AI」を開発したと発表した。また、処理を軽量化し、IoTデバイス上でも単独で動作させることに成功したという。
人の感情や状態を推測するための技術として、顔の表情認識技術が注目されている。デジタルカメラなどでは、笑顔検出による写真の自動撮影機能が実用化されているほか、広告やテレビ番組の視聴時の表情解析に基づく受容度調査など、マーケティング用途での活用も進んでいる。
しかし、既存の表情認識技術では、人間の顔の多くの部位を手掛かりとする解析手法を用いているため、両目がはっきりと見える正面向きの顔にしか対応できない場合が多い。
また、高い精度の表情認識を実現するためには、処理能力の高い計算機環境が必要になるため、既存技術の多くはクラウド上にある計算機に解析したい顔画像を送付しなければならず、利用者のプライバシー保護の観点で大きな課題になっている。
このほど、KDDI総合研究所は独自の機械学習技術「多角適応型モデル制御技術」を開発し、あらゆる方向を向いた顔に対する表情認識を実現。従来技術と異なり、同技術は真横を向いている顔でも正確に表情を認識することができるため、表情認識技術を導入する場面を拡大できると期待される。
また、画像解析のアルゴリズムを効率化することで、従来比1/3倍以下の軽量化を実現し、高速な計算機や通信環境がない状況下での表情認識を可能にした。
具体的には、小型のIoTデバイスの上でも単独動作が可能になり、利用者の顔を含む画像をクラウド等に送信する必要がなく、利用者のプライバシーを保護しながら表情認識を行うことができる。
次ページ:「表情認識AI」の技術的特徴など
技術的特徴
今回開発した表情認識AI「多角適応型モデル制御技術」では、顔の向きの変化への対応可能性を高めながら、軽量な表情認識を実現するため、2段階の機械学習モデルを構築。第1段階では、顔の検出・顔の向き(上・下・左・右・中)を判定した後、第2段階で、顔の向きごとの表情認識モデルを適用することで、表情認識を行う。
これにより、処理の高精度化と効率化を同時に実現。世界的な標準である顔画像データセットLFW(※)を用いて、今回の表情認識AIと他社技術との比較実験を行った結果、顔検出の正解率、表情認識精度のそれぞれにおいて、同技術の優位性を確認した。
特に、顔の向きが45°以上で片目しか映っていない画像に対し、他社技術を上回る精度が実現できたという。
同技術の利用場面
同技術の開発により表情認識技術の導入場面が広がる。たとえば、企業の会議では、室内に複数の人が任意の場所(角度)にいても、各人の表情を同時に認識することができる。
これにより、会議参加者の表情から、議論の活性度などを測定することも可能。また、別の例としては、個人用の宅内ロボットに同技術を適用することにより、住人のプライバシーを保護しつつ、健康状態などをモニタリングするサービスや、利用者の心理状態に合わせて気の利いた対話を行うAIコミュニケーションなどのサービスも実現できる。
同技術はKDDI株式会社のコールセンターに試験的に導入されている。この取り組みでは、コールセンターの応対者(以下、コミュニケーター)が顧客と応対している際に、自身の表情(笑顔)を意識することを目的として、約300名のコミュニケーターが実際の電話応対時に利用している。
コールセンターでは、顧客からの問い合わせに対応するため、たとえば手元のスマートフォンを操作して下向きになるなど、顔の向きが正面から大きく逸れる場面がある。
このような現場においても、同方式による表情認識の精度は97.05%という高い数値を達成。この取り組みを通じて、コミュニケーターの表情に対する意識が向上したほか、応対時の顧客の安心感や信頼度が向上する効果が確認されたという。
※LFW(Labeled Faces in the Wild)は名前付きの顔画像データセット。約5700人から13000枚の顔画像が提供されている。

