KDDI総合研がアングルフリーな「表情認識AI」を開発、IoTデバイス上でも動作

技術的特徴

今回開発した表情認識AI「多角適応型モデル制御技術」では、顔の向きの変化への対応可能性を高めながら、軽量な表情認識を実現するため、2段階の機械学習モデルを構築。第1段階では、顔の検出・顔の向き(上・下・左・右・中)を判定した後、第2段階で、顔の向きごとの表情認識モデルを適用することで、表情認識を行う。

これにより、処理の高精度化と効率化を同時に実現。世界的な標準である顔画像データセットLFW(※)を用いて、今回の表情認識AIと他社技術との比較実験を行った結果、顔検出の正解率、表情認識精度のそれぞれにおいて、同技術の優位性を確認した。

特に、顔の向きが45°以上で片目しか映っていない画像に対し、他社技術を上回る精度が実現できたという。

KDDI総合研がアングルフリーな「表情認識AI」を開発、IoTデバイス上でも動作
表情認識方式の概念図

同技術の利用場面

同技術の開発により表情認識技術の導入場面が広がる。たとえば、企業の会議では、室内に複数の人が任意の場所(角度)にいても、各人の表情を同時に認識することができる。

これにより、会議参加者の表情から、議論の活性度などを測定することも可能。また、別の例としては、個人用の宅内ロボットに同技術を適用することにより、住人のプライバシーを保護しつつ、健康状態などをモニタリングするサービスや、利用者の心理状態に合わせて気の利いた対話を行うAIコミュニケーションなどのサービスも実現できる。

同技術はKDDI株式会社のコールセンターに試験的に導入されている。この取り組みでは、コールセンターの応対者(以下、コミュニケーター)が顧客と応対している際に、自身の表情(笑顔)を意識することを目的として、約300名のコミュニケーターが実際の電話応対時に利用している。

コールセンターでは、顧客からの問い合わせに対応するため、たとえば手元のスマートフォンを操作して下向きになるなど、顔の向きが正面から大きく逸れる場面がある。

このような現場においても、同方式による表情認識の精度は97.05%という高い数値を達成。この取り組みを通じて、コミュニケーターの表情に対する意識が向上したほか、応対時の顧客の安心感や信頼度が向上する効果が確認されたという。

※LFW(Labeled Faces in the Wild)は名前付きの顔画像データセット。約5700人から13000枚の顔画像が提供されている。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録