NVIDIAは新しいAI推論ソフトウェア「NVIDIA TensorRT 3」を発表した。NVIDIA GPUと組み合わせることで画像認識や音声認識、自然言語処理、画像検索、個人に合わせたレコメンデーションなど、AI対応サービスのフレームワークで高速の効率的な推論が可能。NVIDIA Tesla GPUアクセラレータではCPU よりも最大40倍の高速化かつ10分の1のコストで達成できるという。
1,200社以上の企業が、データから新たな洞察を引き出してインテリジェントサービスを企業や消費者に展開するため、NVIDIAの推論プラットフォームを利用しているという。そこには、Amazon、Microsoft、Facebook、Google、Alibaba、Baidu、JD.com、iFLYTEK、Hikvision、Tencent、WeChatなどが含まれる。
TensorRT 3は、高精度のINT8およびFP16でのネットワークの実行が可能になるため、データセンターの運営担当者は調達コストや年間エネルギーコストを数千万ドル単位で節約でき、また開発者が利用すればトレーニング済みのニューラルネットワークを取り入れ、1日で既存のフレームワークよりも3~5倍高速の推論ソリューションを開発できるという。
自律型トラック輸送テクノロジの開発を手がける中国のスタートアップ企業TuSimpleは、TensorRTによる最適化を利用して推論パフォーマンスが30%向上。本年6月には、NVIDIA GPUとカメラを主なセンサーとして使用し、カリフォルニア州サンディエゴからアリゾナ州ユマまでの約270 kmのレベル4テスト走行を成功させたという。
なお、NVIDIAはAIのさらなる高速化に向けて次のソフトウェアを新規導入した。
- DeepStream SDK:
リアルタイムの低遅延ビデオ分析を実行できる。開発者はINT8の精度やGPUアクセラレーテッドのコード変換といった高度なビデオ推論機能を組み込み、オブジェクトの分類や状況の理解などのAIを利用したサービスをサポートする。単一の Tesla P4 GPUアクセラレータで最大30件のHDストリームをリアルタイムで処理できるという。 - CUDA 9:
NVIDIA VoltaアーキテクチャベースのGPU。最大5倍高速なライブラリ、スレッド管理用の新しいプログラミングモデル、デバッグツールやプロファイリングツールの更新をサポート。HPCアプリケーションやディープラーニングアプリケーションを高速化する。Tesla V100 GPUアクセラレータで最大のパフォーマンスを発揮できるよう最適化されている。
【関連リンク】
・エヌビディア(NVIDIA)
・TuSimple
無料メルマガ会員に登録しませんか?

技術・科学系ライター。修士(応用化学)。石油メーカー勤務を経て、2017年よりライターとして活動。科学雑誌などにも寄稿している。