ザイリンクス、ハードウェアとソフトウェアを最適化可能なACAP「Versal」を発表

ザイリンクスは、開発者がソフトウェア プログラマビリティとAI推論で迅速なイノベーションを可能にする、ACAP (Adaptive Compute Acceleration Platform) であるVersalを発表した。

Versal ACAPは、スカラー プロセッシング エンジン、適応型ハードウェア エンジン、およびインテリジェント エンジンと、最先端のメモリ、インターフェイス テクノロジを組み合わせることにより、あらゆるアプリケーションで強力なヘテロジニアス アクセラレーションを実現。

このプラットフォームは、様々な分野の開発者がハードウェアとソフトウェアを最適化してアプリケーション全体の高速化を図ることが可能で、テクノロジの急速な進展に合わせてハードウェアとソフトウェアの両方を即座に適応させることができるように設計されている。

TSMCの7nm FinFET プロセス テクノロジで製造されるVersalポートフォリオは、ソフトウェア プログラマビリティ、特定分野に向けたハードウェア アクセラレーション、および現在の急速なイノベーションへ対応するための適応性を組み合わせたプラットフォーム。独自のアーキテクチャによりクラウド、ネットワーク、無線通信、エッジ コンピューティング、エンドポイントなど、幅広い市場における多くのアプリケーションでスケーラビリティとAI推論能力を発揮するという。

Versalポートフォリオは、以下6つのシリーズで構成される。

  • プライム シリーズ
  • プレミアム シリーズ
  • HBM シリーズ
  • AIコア シリーズ
  • AI エッジ シリーズ
  • AI RF シリーズ

AIエンジンは、幅広い種類のアプリケーションで低レイテンシのAI推論を実行したいという要求に応えることを目的とした新しいハードウェアブロックである。また、無線通信やレーダーなどのアプリケーション向けに高性能DSPの実装をサポート。このエンジンは、Versalの適応型ハードウェア エンジンとの密結合により、アプリケーション全体のアクセラレーション、すなわちハードウェアとソフトウェア両方を調停し性能と効率化を実現する。

このポートフォリオは、多くの市場で幅広く応用可能なVersalプライムシリーズおよびGPU (※1) に比べ約8倍のAI推論性能を発揮するVersal AIコアシリーズから順次市場に投入される。

  • Versal AIコアシリーズ
    Versal AIコアシリーズは、ポートフォリオの中で最高の演算性能と最小のレイテンシを実現し、AI推論のスループットと性能が向上する。このシリーズはクラウド、ネットワークおよび自律テクノロジに最適化されており、幅広いAIおよびワークロード アクセラレーションをサポート。

    Versal AIコアシリーズは5つのデバイスで構成され、128~400個のAIエンジンを内蔵。このシリーズのデバイスはデュアルコア Arm Cortex-A72 アプリケーション プロセッサ、デュアルコア Arm Cortex-R5 リアルタイム プロセッサ、256KBのECC付きオンチップ メモリ、高い浮動小数点精度と低レイテンシに最適化した1,900個を超えるDSPエンジンを内蔵している。

    また、UltraRAM (>130Mb)、ブロック RAM (最大 34Mb)、分散 RAM (28Mb)、および Versal AIシリーズのすべてのエンジンから直接アクセスできる新しいアクセラレータRAM ブロック (32Mb) を組み合わせてカスタムメモリ階層をサポートした190万を超えるシステム ロジック セルも内蔵。

    さらに、8レーン/16レーンのPCIe Gen 4.0およびCCIX ホスト インターフェイス、消費電力を最適化した32G SerDes、最大4つの統合DDR4メモリコントローラー、最大4つのマルチレート イーサネット MAC、650の高性能I/O (MIPI D-PHY、NAND、ストレージ クラス メモリ インターフェイス、LVDS用)、78の MIO (Multiplexed I/O、外部コンポーネント接続用)、40を超える HD I/O (3.3V インターフェイス用) も内蔵している。

  • Versalプライムシリーズ
    Versalプライムシリーズは多くの市場で幅広く応用できるように設計されており、多種多様なワークロードのコネクティビティとインライン アクセラレーションに最適化されている。

    このミッドレンジ シリーズは9つのデバイスで構成され、いずれもデュアルコアArm Cortex-A72 アプリケーション プロセッサ、デュアルコアArm Cortex-R5 リアルタイム プロセッサ、256KBのECC付きオンチップ メモリ、高い浮動小数点精度と低レイテンシに最適化した4,000個を超えるDSPエンジンを内蔵。

    また、UltraRAM (>200Mb)、ブロック RAM (>90Mb)、および分散 RAM (30Mb) を組み合わせてカスタム メモリ階層をサポートした 200万を超えるシステムロジックセルを内蔵。

    さらに、8レーン/16 レーンの PCIe Gen 4.0 および CCIX ホスト インターフェイス、消費電力を最適化した 32G SerDes とメインストリームの 58G PAM4 SerDes、最大6つの統合DDR4メモリ コントローラー、最大 4のマルチレート イーサネット MAC、700の高性能 I/O (MIPI D-PHY、NAND、ストレージ クラス メモリ インターフェイス、LVDS 用)、78の MIO (Multiplexed I/O、外部コンポーネント接続用)、40を超える HD I/O (3.3V インターフェイス用) も内蔵している。

上記のシリーズはすべてネットワーク オン チップ (NoC) によって相互接続される。このNoCは最大28個のマスター/スレーブ ポートを備え、数Tb/sの帯域幅を低レイテンシで実現するほか、電力効率とネイティブなソフトウェア プログラマビリティも特長としている。

Versal ポートフォリオには、開発環境のほか、ドライバー、ミドルウェア、ライブラリ、およびソフトウェア フレームワーク サポートを含む包括的なソフトウェア スタックが提供される。各種ソフトウェア プログラム ツールの詳細は、来年に公開予定。また、Versal プライム シリーズおよび Versal AI コア シリーズの一般向け発売は、2019年後半を予定。

※1 レイテンシ2ms未満のCNN性能とTesla V100の比較

【関連リンク】
ザイリンクス(Xilinx)
台湾セミコンダクター・マニュファクチャリング・カンパニー(TSMC)

Previous

日立アプライアンス、「AIお洗濯」など搭載したコネクテッド洗濯機を発売

DNPとNTTコミュニケーションズ、AIが商品を勧める店頭SPツールを開発

Next