NTT株式会社と株式会社NTTドコモ(以下、ドコモ)は、オンラインや店舗などでの顧客接点から得られる「4W1H」形式に整理された時系列データをもとに、顧客のニーズを予測して販促施策に活用するAI技術「大規模行動モデル(LAM : Large Action Model)」を確立したことを発表した。
LAMとは、大規模言語モデル(以下、LLM)に類似した構造を持った、ラベルや数値に特化した生成AI技術だ。NTTが研究開発したTransformerベースの時系列予測AIで、数値データとカテゴリカルデータが混在し、欠損や偏りを含むデータにも対応することができる。
そして、ドコモが提供するオンライン・オフラインの各種サービスを横断的に統合し、サービス改善を支援する分析基盤により、4W1H形式で異なる接点データを統合的に取り扱うことが可能だ。
例えば、テレマーケティング(以下、テレマ)、商品ページ閲覧、購入の3つの行動において、テレマをした後、商品ページを閲覧し、購入した場合、テレマが商品の認知を促進したと考えられる。
次に、商品の閲覧後、テレマをして購入に至った場合では、テレマが商品への関心を深めたと考えられ、購入後のテレマの場合は、不具合のサポートが考えられる。
このように、前後関係が違えば、各行動の意味が変わる。
LAMは、このような行動の持つ意味を見分けて顧客理解を深め、顧客のニーズを予測する。
また、設計とパラメータの工夫により、ドコモ独自のLAM構築コストを145GPU時間(事前学習に132GPU時間+追加学習に13GPU時間)で実現した。
事前学習では、顧客のニーズを予測するのに必要なパラメータを調整する。一方、追加学習では、販促施策を個別化するのに必要なパラメータを調整する。
この計算コストは、NVIDIA A100(40GB)8基で1日分に満たない計算に相当する。これは、オープンソースのLLMの一つであるLlama-1 7Bの学習リソース(82,432GPU時間)と比較して約568分の1の効率だ。
そして、構築したドコモ独自のLAMを活用し、顧客ごとのニーズとテレマーケティングの必要性をスコア化した。
このスコアをもとに、必要性の高い顧客に優先的に提案することで、モバイルやスマートライフ関連サービスの受注率が従来比で最大2倍に向上する効果を確認した。
提案した複数の顧客へのヒアリングからは、店舗での手続きを希望しながらも、育児などで来店が難しかった顧客や、料金プランの変更に迷っていた顧客などに対して、適切なタイミングで案内できたことが明らかになった。
その他の応用例としては、医療分野における糖尿病治療支援や、エネルギー分野における日射量予測の応用が挙げられている。
今後NTTは、LAMの技術改善を継続するとともに、2028年までにLAMへの入出力の柔軟性を高めて、事業で扱う非言語データの大部分に対応するとしている。
なお、同研究成果の一部は、2025年11月19日~26日に開催される「NTT R&D FORUM 2025 IOWN∴Quantum Leap」に展示予定だ。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。

