12月17日 IIJ Starlilnkセミナー開催

NVIDIA、エージェント型AIの構築を効率化するオープンモデル「Nemotron 3」を発表

複数のAIが連携して複雑なタスクを自律的に遂行する「エージェント型AI」は、エージェント間の通信負荷や、推論にかかる膨大な計算コスト、処理プロセスの不透明性といった課題が顕在化している。

こうした課題に対し、NVIDIAは、エージェント型AI開発を支援するオープンモデル、データ、ライブラリからなる「NVIDIA Nemotron 3」を、2025年12月16日に発表した。

「Nemotron 3」は、開発者が大規模なマルチエージェントシステムを構築・展開するために設計されたモデル群であり、Nano、Super、Ultraの3つのサイズで展開される。なお、SuperおよびUltraの提供は、2026年上半期に予定されている。

「Nemotron 3」の最大の特徴は、独自の「ハイブリッド潜在Mixture-of-Experts(MoE)」アーキテクチャの採用にある。これにより、高い処理能力と推論コストの削減を両立させている。

今回提供が開始された「Nemotron 3 Nano」は、特にコスト効率を重視したモデルである。前世代のモデルと比較して、トークン処理能力(スループット)が最大4倍に向上しているほか、推論に必要なトークン生成量を最大60%削減することに成功した。

これにより、ソフトウェアのデバッグやコンテンツ要約といったタスクにおいて、運用コストを大幅に抑えつつ、高速な処理が可能となる。

また、同モデルはオープンモデルとして提供されるため、企業は自社のデータセンタやクラウド環境など、任意のインフラ上で「ソブリンAI(主権型AI)」を構築できる。

これにより、データの機密性を保持しながら、各国の規制や企業の独自ルールに則ったカスタマイズが可能となるため、セキュリティやガバナンスを重視する金融・医療・製造といった産業分野での導入加速が期待されている。

さらにNVIDIAは、特化型AIエージェントを構築するすべての人が利用できる、トレーニングデータセットと強化学習ライブラリのコレクションもリリースした。

これには、3兆トークンに及ぶNemotronの事前トレーニング、事後トレーニング、強化学習データセットが含まれており、高度な能力を持つドメイン特化型エージェントの作成に必要な、豊富なリーズニング、コーディング、そして複数ステップのワークフロー例を提供する。

加えて、NeMo GymとNeMo RLというオープンソースライブラリをリリースした。これらは、Nemotronモデルのトレーニング環境と事後トレーニングの基盤を提供するとともに、モデルの安全性とパフォーマンスを検証するためのNeMo Evaluatorも提供する。

なお、全てのツールとデータセットは、GitHubとHugging Faceで公開されている。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録
カテゴリー DX