NVIDIAは本日、ラスベガスで開催されているCES2025にて、自動運転車やロボットなどのフィジカルAIシステムの開発を促進するプラットフォーム「NVIDIA Cosmos」を発表した。
通常、フィジカルAIモデルの開発にはコストがかかり、膨大な量の実世界のデータとテストが必要だ。そこで「Cosmos」は、開発者が既存のモデルをトレーニングおよび評価するための、大量のフォトリアルな物理ベースの合成データを生成する方法を提供する。
また開発者は、「Cosmos」をファインチューニングしてカスタムモデルを構築することもできる。フィジカルAIの研究開発専用に構築されており、テキスト、画像、ビデオなどの入力とロボットセンサまたはモーションデータの組み合わせから物理ベースのビデオを生成できる。
モデルは、物理ベースのインタラクション、オブジェクトの永続性、倉庫や工場などのシミュレートされた産業環境やさまざまな道路状況を含む運転環境の生成を目的として構築されている。
なお「Cosmos」は、オープンモデルライセンスの下で提供され、開発者は「NVIDIA API」カタログで最初のモデルをプレビューするか、「NVIDIA NGC」カタログまたは「Hugging Face」から一連のモデルとファインチューニング フレームワークをダウンロードすることが可能だ。
すでに、1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi、XPENGなどのロボティクスや自動車会社に加え、ライドシェアリングの Uberが「Cosmos」を採用する企業に含まれているという。
NVIDIA の創業者兼CEOであるジェンスンフアン氏は、「ロボティクスにChatGPTの時代が到来しつつあり、大規模言語モデルと同様に、世界基盤モデルはロボットおよび自動運転車開発の進歩に不可欠だ。しかし、すべての開発者が独自のモデルをトレーニングするための専門知識とリソースを持っているわけではないため、NVIDIAがフィジカルAIを民主化し、一般的なロボティクスをすべての開発者が利用できるようにするために「Cosmos」を作成した」と述べている。
また、ジェンスンフアン氏はCESの基調講演で、フィジカルAI開発者による「Cosmos」モデルの使用例を紹介した。
これには、雪道の状況や倉庫の混雑などのビデオデータから特定のトレーニングシナリオを見つけるといったことや、物理ベースのフォトリアルな合成データ生成、「Cosmos」と「Omniverse」を活用したマルチバースシミュレーションなどが含まれている。
なお「Cosmos」は、Hugging FaceおよびNVIDIA NGCカタログでNVIDIAのオープンモデルライセンスに基づいて現在提供されている。さらに、NVIDIA NIMマイクロサービスとしてもまもなく提供される予定だ。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。