広告掲載　 | 会員登録　

2026-01-202026-01-20

NTTドコモ、場の空気や資料を理解した上で自律支援するAIエージェント実現へ向け「マルチモーダルDX基盤」を開発

TOP > 人工知能（AI） > NTTドコモ、場の空気や資料を理解した上で自律支援するAIエージェント実現へ向け「マルチモーダルDX基盤」を開発

企業：NTTドコモ（NTT docomo）

by IoTNEWS編集部

企業においてLLM（大規模言語モデル）の活用が進む中、会議や接客といった音声コミュニケーションの現場における業務変革が期待されている。

しかし、従来の音声だけの分析では、対話の文脈や周囲の状況を完全に把握することは難しく、AIが人間に代わって適切な判断や行動をとる「AIエージェント」の実用化には課題があった。

こうした中、株式会社NTTドコモは、従来の音声分析に加え、映像やテキストなどの多様な情報を統合的に分析する「マルチモーダルDX基盤」を開発したことを発表した。

同基盤は、人間がコミュニケーションを行う際と同様に、複数の種類の情報（マルチモーダル）を掛け合わせて状況を理解することができるというものだ。

NTTドコモはこれまで、音声認識や感情解析を行う「音声DX基盤」を展開してきたが、今回これを拡張し、NTTグループの次世代メディア処理AI「MediaGnosis」の技術を搭載したサーバである「SpeechRec Server」とも接続できるようにしたほか、LLMと連携させた形だ。

これにより、参加者の表情から読み取る「映像ニュアンス分析」や、提示されている資料の内容を理解する「資料分析」が可能となった。

NTTドコモ、場の空気や資料を理解した上で自律支援するAIエージェント実現へ向け「マルチモーダルDX基盤」を開発 — マルチモーダルDX基盤の全体像

音声、映像、テキストという異なる情報を共通のインターフェースで分析・統合することで、AIエージェントは「誰が、どのような表情で、何の資料を見ながら話しているか」という文脈まで深く理解できるようになる。

特に実務面での効果が期待できるのが、新たに追加された「資料分析」機能だ。これは、会議中に投影されている画面や事前に配布されたPDF資料をAIが読み取り、記載されている専門用語や文脈を解析する技術だ。

この情報を音声認識エンジンに連携させることで、社内用語や業界用語の誤変換を減らし、議事録の精度を向上させる。

また、会議中の議論と資料の内容を突き合わせることで、より具体的で正確な要約文をリアルタイムに生成することも可能となる。

NTTドコモ、場の空気や資料を理解した上で自律支援するAIエージェント実現へ向け「マルチモーダルDX基盤」を開発 — 資料分析技術の全体像

さらにNTTドコモは、同基盤を活用した具体的なユースケースとして「会議支援エージェント」の開発を進めているとのことだ。

これは単なる記録係にとどまらず、会議の進行状況に合わせて必要な社内データを自律的に検索して提示したり、議論が停滞した際にアドバイスを行ったりするシステムだ。

同社は今後、分析できる情報の種類をさらに拡充し、企業の持つ社内データと掛け合わせることで、高度な判断が求められる接客や営業などの領域においても、AIエージェントによる業務の自律化・自動化を推進していく方針だ。

無料メルマガ会員に登録しませんか？

膨大な記事を効率よくチェック！

IoTNEWSは、毎日新着ニュースを公開しております。

週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

AIに関する最新ニュース
実践を重要視する方に聞く、インタビュー記事
業務改革に必要なAI活用方などのノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録

IoTNEWS編集部

IoTに関する様々な情報を取材し、皆様にお届けいたします。

企業向けAI活用虎の巻

AIによって「優秀な人材」の定義が変化したことを、どうみるべきか　—AI時代の人材採用と教育

AIによって「優秀な人材」の定義が変化したことを、どうみるべきか　—AI時代の人材採...

まだ、生成AIのチャットボットで消耗しているの？　ー自律的に動くAIエージェントが働き方を180°変える

まだ、生成AIのチャットボットで消耗しているの？　ー自律的に動くAIエージェントが働...

AI時代の「中間管理職クライシス」　—部下がAIに相談する時代、上司の価値はどこに残るか？

AI時代の「中間管理職クライシス」　—部下がAIに相談する時代、上司の価値はどこに残...

AIに仕事を頼む技術　—なぜ「営業資料を作って」と頼むと失敗するのか？

AIに仕事を頼む技術　—なぜ「営業資料を作って」と頼むと失敗するのか？

生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙

生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙

AIに「ゴミ」を食わせるな　ーAIエージェントが賢くなるデータ、バカになるデータ

AIに「ゴミ」を食わせるな　ーAIエージェントが賢くなるデータ、バカになるデータ

AIで業務を自動化する方法とは　ーなぜ、ChatGPTを配っても仕事は減らないのか？

AIで業務を自動化する方法とは　ーなぜ、ChatGPTを配っても仕事は減らないのか？

なぜあなたの会社で、生成AIが活用されないのか？どこで活用すべきか？

なぜあなたの会社で、生成AIが活用されないのか？どこで活用すべきか？

生成AI活用ガイド

ロー・ノーコードツールDifyとn8n、あなたの業務に最適なのはどっち？両者の思想・機能・構築プロセスの全容を解説

ロー・ノーコードツールDifyとn8n、あなたの業務に最適なのはどっち？両者の思想・...

AIでスカウト文を自動生成！プロフィールから「コピペ感ゼロ」の刺さる文案を自動生成する仕組みを解説

AIでスカウト文を自動生成！プロフィールから「コピペ感ゼロ」の刺さる文案を自動生成す...

「CV増が売上に繋がらない」を解消！n8nでリードスコアリングと戦略立案を自動化する方法を解説

「CV増が売上に繋がらない」を解消！n8nでリードスコアリングと戦略立案を自動化する...

ノーコードで実現！人事データの不整合を自動抽出する給与監査システムの構築方法を解説

ノーコードで実現！人事データの不整合を自動抽出する給与監査システムの構築方法を解説

AIはどんな業務を効率化できる？13の検証事例から見えた生成AI導入方法と活用を徹底解説

AIはどんな業務を効率化できる？13の検証事例から見えた生成AI導入方法と活用を徹底...

現代のOJTの新常識！？Difyで教育を「補完」する対話型AIメンターの構築方法を解説

現代のOJTの新常識！？Difyで教育を「補完」する対話型AIメンターの構築方法を解...

Dify×GASで契約書レビューからデータ蓄積・管理までを行う生成AIシステムの構築方法を解説

Dify×GASで契約書レビューからデータ蓄積・管理までを行う生成AIシステムの構築...

顧客の声を生成AIで活用できる資産へ、ボタンひとつで分析するシステムの構築方法を解説

顧客の声を生成AIで活用できる資産へ、ボタンひとつで分析するシステムの構築方法を解説

SNS運用をAIで内製化するには？カスタムAIとノーコードツールで効率化する方法を解説

SNS運用をAIで内製化するには？カスタムAIとノーコードツールで効率化する方法を解...

飲食店運営にAIをどう活用する？「在庫・ロス管理」「売上機会の損失」に対するAIシステムを提案

飲食店運営にAIをどう活用する？「在庫・ロス管理」「売上機会の損失」に対するAIシス...