ケイデンス・デザイン・システムズ社(以下、ケイデンス)は、スタンドアローンで自己完結型のニューラルネットワークDSP IPコアであるTensilica Vision C5 DSPを発表した。
このIPコアは、ニューラルネットワークに必要な演算能力を高いレベルで提供し、ビジョン、レーダー/ライダー、センサーフュージョンなどのアプリケーション向けに最適化されているという。Vision C5 DSPは、自動車、監視カメラ、ドローン、モバイルやウェアラブル市場などをターゲットとしており、あらゆるニューラルネットワークの演算タスクを実行できる、毎秒1テラMACの演算能力を提供するとしている。
ニューラルネットワークはより深く、より複雑になってきているため、演算能力に対する要求が急速に高まっている。一方で、絶えず新しいネットワークが現れ、次々に新しいアプリケーションや市場が現れるため、ニューラルネットワークのアーキテクチャは常に変化している。このようなトレンドにより、将来にわたって運用が保証される柔軟性と低リスクを実現し、低消費電力なだけでなく高度にプログラマブルな組み込みシステムを可能とする、高性能で汎用性の高いニューラルネットワーク処理のソリューションに対するニーズが高まっている。
自動車、ドローン、セキュリティーシステムなどカメラをベースとするビジョンシステムには、基本的に2種類のビジョンに最適化された演算が必要となる。1つ目は、従来の写真用またはイメージング処理のアルゴリズムを使用したカメラからの入力データの補正。2つ目は、ニューラルネットワークベースの認識アルゴリズムにより実行される物体検出および認識。
既存のニューラルネットワークアクセラレーターのソリューションは、イメージングDSPに付加されたハードウェアアクセラレーターであり、ニューラルネットワーク処理のコードをDSP上で実行させるネットワーク層と、アクセラレーターにオフロードさせる畳み込み層に分離して処理する。この組み合わせは非効率で余計な電力を消費してしまうという。
Vision C5 DSPは、ニューラルネットワークに特化し最適化されたアーキテクチャを採用しているため、畳み込み関数だけでなく、あらゆるニューラルネットワークの演算層(畳み込み、全結合、プーリング、正規化)を高速化するという。これにより、Vision C5 DSPが推論タスクを実行する間に、独立して画像補正アプリケーションを実行できるようメインのビジョン/イメージングDSPを解放する。
ニューラルネットワークDSPとメインのビジョン/イメージングDSP間における余計なデータ転送をなくすことにより、Vision C5 DSPは競合するニューラルネットワークアクセラレーターよりも低電力なソリューションを提供し、さらにニューラルネットワーク向けの単純な、シングルプロセッサーのプログラミングモデルを提供する。
Vision C5 DSPの特徴および機能は以下の通り。
- 1平方ミリメートル未満のシリコンエリアで毎秒1テラMACの演算性能(Vision P6 DSPの4倍のスループット)を持ち、ディープラーニングカーネルで極めて高い演算スループットを提供
- 1024 8ビットMACまたは512 16ビットMACにより、8ビットおよび16ビットの解像度で非常に優れたパフォーマンスを提供
- 128ウェイ8ビットSIMD、64ウェイ16ビットSIMDを備えるVLIW SIMDアーキテクチャ
- マルチコア設計向けに構築されており、小さいフットプリントで数テラMACソリューションを実現
- 統合iDMAおよびAXI4インターフェイス
- Vision P5 DSPおよびVision P6 DSPと同じ、実績あるソフトウェアツールセットを利用可能
- 市場で入手可能なGPUとの比較で、Vision C5 DSPは広く知られたAlexNet CNNのパフォーマンスベンチマークで最大6倍高速、Inception V3 CNNパフォーマンスベンチマークで最大9倍高速
Vision C5 DSPは様々なカーネルサイズ、深さ、入力ディメンションをサポートする柔軟性があり、将来にわたって使用可能なソリューションだとしている。また、ネットワークの係数データを圧縮、伸張する機能をいくつか実装しており、進化に合わせて新しい層の追加にも対応する。これに対して、ハードウェアアクセラレーターはプログラマビリティが限定されているため、提供されるソリューションは柔軟性に欠けるという。
Vision C5 DSPには、CaffeおよびTensorFlowなどのツールを利用して学習されたあらゆるニューラルネットワークを、実行ファイルおよびVision C5 DSP向けにコードにマッピングするケイデンスのneural network mapperツールセットが付属しており、ハンド・オプティマイズされた包括的なニューラルネットワークライブラリ関数を有効活用することができるとしている。
【関連リンク】
・ケイデンス(Cadence)
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。