GTCで発表された、NVIDIA Researchによるディープラーニング研究

本稿は、昨日、NVIDIAのブログ記事で発表された内容である。

NVIDIA の創業者兼 CEO であるジェンスン・フアン (Jensen Huang) 氏は、サンノゼの GPU テクノロジ カンファレンスの基調講演で、従来のコンピューター グラフィックスを覆す可能性を秘めている 2 つのディープラーニングの研究結果を取り上げた。

いずれの研究結果も、ゲーム開発者が開発期間を短縮し、コストを削減して、よりリッチなエクスペリエンスを生成するのに役立つと見込まれる。また、もっと多様な道路条件、環境、場所について自動車をトレーニングするためのデータを簡単に作成することによって、自動運転車の開発が加速される可能性がある。

この一組の研究プロジェクトは、産業を発展させるために、同社がディープラーニングに関する経験とコンピューター グラフィックスに関する長い歴史を組み合わせている方法を示す最新の例だ。

世界中の 11 か所の拠点にわたり 200 人で構成される NVIDIA Researchチームは、機械学習、コンピューター ビジョン、自動運転車、ロボット工学、グラフィックス、コンピューター アーキテクチャ、プログラミング システムなどの分野でテクノロジの限界を広げることに注力している。

GTCで発表された、NVIDIA Researchによるディープラーニング研究
この 2 つの画像は、同じ画像からノイズを除去したものだ。左側の画像のノイズ除去は、対応するクリーンな画像とノイズのある画像でニューラルネットワークをトレーニングすることによって実行された。右側の画像では、ノイズのある画像のみでトレーニングしたモデルを使用してノイズを除去した。

画像のノイズ除去

ノイズのある画像とはどのようなものか分からないかもしれないが、おそらくノイズのある写真を撮ったことはあるだろう。薄暗いシーンにカメラを向けると、奇妙な色の斑点や、輝点と呼ばれる白い点がある不鮮明な写真が撮影される。

画像からのノイズ除去は、この処理自体によって不自然なアーチファクトが生じたり、不鮮明になったりすることがあるために困難だ。ディープラーニングの実験によってソリューションが提供されたが、ニューラルネットワークをトレーニングするために、対応するクリーンな画像とノイズのある画像の組み合わせが必要であるという重大な欠点があった。

このソリューションはクリーンな画像がある限り動作するが、このような画像を入手することは困難であり、場合によっては不可能なことがある。フィンランドとスウェーデンの NVIDIA Researchの研究員は、この問題を回避するため Noise2Noise と呼ばれるソリューションを開発した。

GTCで発表された、NVIDIA Researchによるディープラーニング研究
通常 AI によるノイズ除去では、対応するクリーンな画像とノイズのある画像の組み合わせが必要。しかし、多くの場合、MRI やその他の医療画像に対してクリーンな画像を入手するのは困難だ。Noise2Noise では、クリーンな画像が不要。

「不完全なデータからは不完全な結果しか得られない」とは限らない

クリーンな画像の作成は、MRI のような医療画像検査と遠く離れた星や惑星の天体写真 (クリーンな画像を撮影するには時間と光量が少なすぎる状況) において一般的な課題だ。

コンピューター グラフィクスでは、時間も問題となる。ノイズ除去システムをトレーニングするためにクリーンな画像データを作成するタスクだけで、数日または数週間かかることがある。

Noise2Noise について初めて聞いたときには、実現不可能であるように思われる。対応するクリーンな画像とノイズのある画像の組み合わせでネットワークをトレーニングする代わりに、これは対応するノイズのある画像の組み合わせ (ノイズのある画像のみ) でネットワークをトレーニングする。しかし、Noise2Noise では、従来の方法でトレーニングしたネットワークで達成できる結果と同等またはほぼ同等の結果が得られる。

レゴ ブロックのような容易さ

フアン氏が取り上げた第 2 のプロジェクトは、仮想世界を構築するまったく新しい方法に関するものだ。この方法では、ディープラーニングを利用して、ゲームの 3D モデリングと自動運転車向けのトレーニング データの入手に関して、面倒でコストのかかる作業が大幅に軽減される。

セマンティック マニピュレーションと呼ばれるこの技法は、子供がブロックを組み合わせてジェット機からドラゴンまで何でも作ることができるレゴに似ている。

セマンティック マニピュレーションでは、初めにラベル マップ (シーン内の各ピクセルにラベルを付けた青写真) を扱う。マップ上のラベルを切り替えてオフにすると、画像が変化する。異なるタイプの自動車、樹木、道路を選択するようオブジェクトのスタイルを編集することもできる。

GTCで発表された、NVIDIA Researchによるディープラーニング研究
NVIDIA Researchの研究員のディープラーニングに基づく画像合成技法により、セマンティック ラベルを変更するだけで、道路の外見を変えることができるようになる。

困難なゲーム開発

この研究チームの手法では、不足しているトレーニング データを生成するために使用されることが多いディープラーニング技法、GAN (Generative Adversarial Networks: 敵対的生成ネットワーク) を活用している。

一般に、GAN で写真のようにリアルな高解像度画像を生成することは困難だが、NVIDIA 研究員はこれを可能にするようアーキテクチャを変更することができた。

今日、コンピューター ゲーム用の仮想環境を生成するには、CG デザイナーがモデルを作成し修正するのに数千時間を要し、1 つのゲームあたり 1 億ドル前後のコストがかかることがある。このようなモデルをレンダリングすることによって、画面上にゲームが表示される。

必要な労働量が削減されると、ゲーム デザイナーとスタジオは、キャラクターとシナリオを増やして、もっと複雑なゲームを作成できるようになる。

航空機なしでサンフランシスコからバルセロナまで対応

自動運転車をトレーニングするためのデータの取得にも、同様に多くの手間がかかる。このデータは、一般にセンサーとカメラを搭載した数台の自動車を道路上で走行させることによって取得する。次に、自動運転車のトレーニングに使用するため、自動車によって取得されたデータに手動でラベルを付けなければならない。

研究チームの手法によって、たとえばサンフランシスコからデータを取得し、バルセロナなどの起伏の大きい別の都市にそのデータを適用できるようになる可能性がある。石畳の道路を舗装された道路に変換したり、並木道を自動車が一列に駐車された道路に変換したりすることができる。

これにより、多様な状況に対応するため、自動車をもっと効果的にトレーニングできるようになる可能性がある。また、現実世界のデータでトレーニングされ、生成モデルを使用してレンダリングされるグラフィック レンダリング エンジンの実現も想定される。

【関連リンク】
エヌビディア(NVIDIA)

Previous

Cerevo、IoTハードウェアの新会社Shiftallをパナソニックへ売却

SKYFchainとCARCIEL Inc.、建設および消防におけるドローンアプリケーションを共同開発

Next