英Armは、機械学習(Machine Learning、以下ML)およびニューラル・ネットワーク(Neural Network、以下NN)向けの新プロセッサをはじめとするArm プロセッサIP(半導体設計資産)のスイートである「Project Trillium」を発表した。
第一弾のテクノロジーはモバイル市場に焦点を当てており、最先端の物体検出(Object Detection、以下OD)を含む高度な演算能力を備えた新世代のML搭載デバイスを実現するものだという。
同製品は、2018年4月に初期プレビュー版として利用可能となり、一般提供の開始は2018年中頃を予定しているという。
発表の主な内容は以下の3点だ。
- エッジデバイスに機械学習(ML)機能をもたらす、新たなArm IPスイート
- 高い性能と効率性を実現するアーキテクチャにより、Arm MLプロセッサおよび物体検出(OD)プロセッサが、様々な用途においてユーザー体験を提供
- 新たなIPにもとづく新製品により、モバイルデバイスにおいて秒単位で数兆回ものML演算が可能に
現在のMLテクノロジーは一般的に、特定のデバイス層や特定業種のニーズに特化する傾向があるが、Armの「Project Trillium」は高い拡張性により汎用的なテクノロジーを提供するという。
第一弾ではモバイルプロセッサ向けに特化して提供されるが、将来のArm ML製品はモバイルのみならず、センサーやスマートスピーカー、ホームエンターテインメントなどさまざまな用途において、最適な性能を提供するということだ。
Armの新しいMLおよび物体検出プロセッサは、スタンドアローンのCPU、GPU、アクセラレータよりも効率化を実現するだけでなく、DSPによる従来のプログラマブル・ロジックよりも高速になっている。
Arm MLプロセッサについては、拡張性に優れたArm MLアーキテクチャをベースとし、機械学習アプリケーションでの最高のパフォーマンスと効率性を達成できるよう、MLに特化して一から設計されたものだという。特長は以下の通りだ。
- モバイルコンピューティングにおいて、毎秒4.6兆回以上の演算(4.6TOPs)が可能
- インテリジェントなデータマネジメントにより、複雑な環境で実際使用した際にさらに約2~4倍の性能向上を達成
- 毎秒1ワットあたり3兆回以上の演算(3TOPs/W)が可能な電力効率性により、熱環境やコスト制約のある環境でかつてないパフォーマンスを発揮。
Arm ODプロセッサは、人物やその他の物体を効率的に検知するために特化して設計されており、1フレームあたりほぼ無制限の数を検出できるという。特長は以下の通りだ。
- 60 fps(フレーム/秒)のフルHD映像に対応したリアルタイム検知
- 従来型DSPの最大80倍のパフォーマンスを実現し、前世代のArm製品に比べて検知品質が向上
Arm NNソフトウェアは、Arm Compute LibraryおよびCMSIS-NNとともに使用することで、NNに最適化された機能を提供するという。
また、TensorFlowやCaffe、Android NNといった既存のNNフレームワークと、Arm Cortex CPU、Arm Mali GPU 、MLプロセッサなどフルレンジのArmプロセッサとの橋渡しとして機能する。
【関連リンク】
・ARM
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。