GTCで発表された、NVIDIA Researchによるディープラーニング研究

本稿は、昨日、NVIDIAのブログ記事で発表された内容である。

NVIDIA の創業者兼 CEO であるジェンスン・フアン (Jensen Huang) 氏は、サンノゼの GPU テクノロジカンファレンスの基調講演で、従来のコンピューターグラフィックスを覆す可能性を秘めている 2 つのディープラーニングの研究結果を取り上げた。

いずれの研究結果も、ゲーム開発者が開発期間を短縮し、コストを削減して、よりリッチなエクスペリエンスを生成するのに役立つと見込まれる。また、もっと多様な道路条件、環境、場所について自動車をトレーニングするためのデータを簡単に作成することによって、自動運転車の開発が加速される可能性がある。

この一組の研究プロジェクトは、産業を発展させるために、同社がディープラーニングに関する経験とコンピューターグラフィックスに関する長い歴史を組み合わせている方法を示す最新の例だ。

世界中の 11 か所の拠点にわたり 200 人で構成される NVIDIA Researchチームは、機械学習、コンピュータービジョン、自動運転車、ロボット工学、グラフィックス、コンピューターアーキテクチャ、プログラミングシステムなどの分野でテクノロジの限界を広げることに注力している。

GTCで発表された、NVIDIA Researchによるディープラーニング研究 — この 2 つの画像は、同じ画像からノイズを除去したものだ。左側の画像のノイズ除去は、対応するクリーンな画像とノイズのある画像でニューラルネットワークをトレーニングすることによって実行された。右側の画像では、ノイズのある画像のみでトレーニングしたモデルを使用してノイズを除去した。

画像のノイズ除去

ノイズのある画像とはどのようなものか分からないかもしれないが、おそらくノイズのある写真を撮ったことはあるだろう。薄暗いシーンにカメラを向けると、奇妙な色の斑点や、輝点と呼ばれる白い点がある不鮮明な写真が撮影される。

画像からのノイズ除去は、この処理自体によって不自然なアーチファクトが生じたり、不鮮明になったりすることがあるために困難だ。ディープラーニングの実験によってソリューションが提供されたが、ニューラルネットワークをトレーニングするために、対応するクリーンな画像とノイズのある画像の組み合わせが必要であるという重大な欠点があった。

このソリューションはクリーンな画像がある限り動作するが、このような画像を入手することは困難であり、場合によっては不可能なことがある。フィンランドとスウェーデンの NVIDIA Researchの研究員は、この問題を回避するため Noise2Noise と呼ばれるソリューションを開発した。

「不完全なデータからは不完全な結果しか得られない」とは限らない

クリーンな画像の作成は、MRI のような医療画像検査と遠く離れた星や惑星の天体写真 (クリーンな画像を撮影するには時間と光量が少なすぎる状況) において一般的な課題だ。

コンピューターグラフィクスでは、時間も問題となる。ノイズ除去システムをトレーニングするためにクリーンな画像データを作成するタスクだけで、数日または数週間かかることがある。

Noise2Noise について初めて聞いたときには、実現不可能であるように思われる。対応するクリーンな画像とノイズのある画像の組み合わせでネットワークをトレーニングする代わりに、これは対応するノイズのある画像の組み合わせ (ノイズのある画像のみ) でネットワークをトレーニングする。しかし、Noise2Noise では、従来の方法でトレーニングしたネットワークで達成できる結果と同等またはほぼ同等の結果が得られる。