あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」

PR

GDEP Advanceセミナー2019「ディープラーニングの今とこれから」

2019年10月23日にGDEPアドバンス社は、秋葉原UDXカンファレンスで無料セミナー「ディープラーニングの今とこれから」を開催。このセミナーでは、ディープラーニングにはもはや欠かせないNVIDIAのGPUに関する最新情報、そして実際にNVIDIA製品を活用した数多くのAIシステムの事例が紹介された。

ディープラーニングのブレークスルーによって、これまでできなかったことができるようになったものの、理論だけではビジネスには活かせない。実際に自社でAIシステム開発をしようとすると、必要な計算リソースや必要なデータ量、そして稼働後の維持管理など、開発・運用面でのさまざまな疑問が広がるからだ。このセミナーでは、ふだんはあまり見ることができない事例が多数紹介されたため、アルゴリズムやデータの工夫、コストの削減のヒントなど、実際に開発現場でさまざまな知見が得られる貴重な場となった。

GPUは所有からクラウドの時代へ

NVIDIA社は、最新モデルとして同社のTesla V100 32GB CPUを16基搭載した「DGX-2」を紹介。従来のDGX-1に比べて2倍以上の処理速度となる2ペタFLOPSを実現するモンスターマシンだ。

16基のGPUを全結合する通信バス「NV Switch」によってGPU間の通信ボトルネックが解消し、複数のGPUユニット連携処理の高速化に貢献する。

あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」

処理能力が高いDGX-2だが、10kWもの電力を消費するため、運用が手軽とは言えない。そこで利用したいのが、クラウドでDGX-2を提供する「GDEP DGXクラウド」だ。GDEP DGXクラウドは、「DGX Ready Data Center」と呼ばれる余裕ある電源供給と冷却能力のあるデータセンターで運用し、リモートアクセスでDGX-2を提供するクラウドサービス。root権限ありのベアメタルマシンとして提供されるため、自社で運営するのと利用感はまったく変わらない。ホスティングは富士通、運用・サポートはGDEPアドバンス社が行っている。

あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」

クラウド環境でGPUを利用する場合、会社全体でクラウドサービスを契約し、所属のデータサイエンティストやAIエンジニアが共有して利用する形態となる。そうすると、処理したい計算を契約中のクラウドのGPUクラスタに効率的に分散処理する必要がある。そのためのシステムとして、同社のオープンソースツール群であるDeepOpsが紹介された。DeepOpsを使えば、エンジニアはKubernetesおよびKubeflowによるディープラーニング用クラスターを容易に構築することができる。

GPUを使えば学習時間が軽減し、設計や検証に時間を割ける

セミナーでは、NVIDIA GPUを実際に使っているさまざまな企業が、その事例を数多く紹介した。

アノテーションの効率化と学習時間に短縮が重要

数多くの業務システムを手がけ、コミュニケーションロボット「PALRO」をはじめとするAIシステム開発にも注力し、「AIインテグレーター」としてビジネスを展開する富士ソフトは、大学病院と共同調査研究している「骨折予測AI」を紹介。レントゲンやCT画像から大腿部骨折を判定するもので、従来こうした判定は読影医が担当しており、その判定枚数は年間数万枚にのぼるという。

セミナーでは、本システムを実装するにあたって得た知見が2つ示された。ひとつは、アノテーション作業の効率化。今回学習作業では、専門医プロジェクトが構成され、目視によるアノテーションが実施された。その際プラットフォームにはNVIDIA Project Clara、ビューアにはMITKも採用し、3軸表示のビューアで複数の点をポイントするだけで、臓器の部分をセグメーテーションできるようにしたツールを採用。こうしたツールによって、アノテーション作業の効率が大きく向上したという。

あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」

もうひとつはスピード。AIシステム開発は限られた時間内でよいものを作ることが重要で、そのためにはモデルの学習時間を削り、その時間をデータのクレンジングやAIのモデル検討、チューニングなどに費やすべきだという。今回、学習には、NVIDIA DGX-2 GPUを4基以上用い、従来のCPU環境では600時間掛かるところを6時間で完了。結果、3ヶ月の検証期間を1ヶ月に短縮し、医療にAIを適用する可能性、次の研究テーマへの採択を決定づけた。

同社では、NVIDIA DGX-2をデータセンターで運営しており、GPUリソースを必要とするエンジニアが、すぐに利用できる環境を整えることで、スタートアップの時間の短縮にも成功している。

モデルに応じた適切なデータ量がある

社員の70人以上がデータサイエンティストであるテクノスデータサイエンス・エンジニアリング社は、AIで送電線を点検するシステムを紹介した。

送電線は経年劣化によって、さびや断線が発生する。現在は送電線をヘリコプターでVTR撮影し、それを10分の1の速度でスロー再生しながら熟練作業員が目視で確認。その時間は延べ1330時間(2016年度実績)と、作業員の負担が大きい。本AIシステムは、AIを使ってビデオ画像を正常と異常に仕分け、報告書の自動作成までを実現する。導入により2019年度は50%削減をすでに実現。2020年度には80%削減を目指している。

あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」

セミナーでは過去のAIプロジェクトの経験から、成功するためのノウハウが紹介された。成功の条件としてAI導入後の展開のないAI開発はしないこと、段階的にAIを導入することが大事だという。またデータサイエンティストはすべてに長けているわけではないので、開発部門や顧客を巻き込んで進めることも重要だという。

またデータについても言及があった。ひとつはデータの収集について。データ収集はAIビジネスの計画に入れるべきだという。その理由は、実際にデータがあるといってもアノテーションされていないなど使えないデータであることも多いためだ。もうひとつは収集すべきデータ量について。同社によると、選択したモデルによって適切なデータ量というものがあるという。たとえば今回の送電線確認AIの案件では、VGG16で転移学習しており、このモデルの場合は学習パラメータが1億3800万ぐらいある。こうした大量のパラメータを最適化するためには、理論的に何十万枚もの画像学習が必要であるという。

GPUを使えば再学習がわずか5分で完了

将棋AIの開発で有名なHEROZは、将棋で使われていたAIエンジンを汎用的にさまざまな分野に適用できるようにした「HEROZ Kishin」というAIサービスを紹介。その運用事例を数多く紹介した。

たとえば、建築分野では「建築物の部材設計にムダがないかどうかを判定するシステム」「ビルの空調をAIで制御するシステム」、金融分野では「株式ポートフォリオにAIを適用して売りどきかどうかを判定するシステム」、品質管理分野では「未来予測」や「異常検知」、さらに「ソフトウェアテスト」などの事例も紹介した。

まさに事例は山のようにあり、「スマホのアプリにおいて、ユーザーの行動を分析することで、レビューで高評価を得やすいようにするシステム」などもあった。

こうしたシステムでは時系列のデータを扱うことも多い。時系列データはデータの傾向が変わるため、精度を高めるには再学習が必須だという。現在、GPUを使えば5分ほどで再学習が完了するため、時系列のデータも扱いやすくなったとのことだ。

あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」
同社によると、AIが得意なことは2つだという。ひとつは、「法則が自明ではない膨大なデータから法則を見つけ出す処理」、もうひとつは「法則はわかっているが、その法則に従った最適解の手順がわからない処理」。前者が得意とするのはディープラーニングで、これには充分な量のデータと精度が必要。後者が得意とするのは機械学習で、正確にルールを書くことが大事でデータ量はあまり重要ではない。なぜなら、たとえば将棋で言えば、自己対局することで賢くできるからだという。

逆に、AIができずに人間がやらなければならないこととしては、論理立てて問題を解決し、その結果、何かの事象について説明することだという。こうした仕事については、AIではなく今後も人間がやっていくことになるだろうと述べた。

AIは結果の見せ方も大事

ソフトバンクは、インフラや社内研修におけるAIの活用事例を2つ紹介した。ひとつはドローンを使った基地局の点検。基地局は、経年劣化によってさびやボルトの緩みなどが発生する。現在は作業員が実際にのぼって保守点検しているが、高所のため事故もある。そうした負担を減らす仕組みとして、ドローンを用いたさびの検出モデルが紹介された。細かいボルトまで確認するために8Kの精細な画像を利用。しかしそのまま推論すると推論のコストが高い。そこで一度画像から3Dテクスチャを作成。学習は2Dで行い、推論は3Dテクスチャで行うことで、推論にコストを掛けないように工夫したという。

あらゆるシーンで活躍するAIを支える「NVIDIA×ディープラーニング」

もうひとつの事例は、ソフトバンクユニバーシティの研修制度における「プレゼンテーション話し方研修」の評価をAI化する事例だ。プレゼンテーションの個別チェックは講師の負担が高い。そこで、研修者の話し方を動画として記録。そこから音声、音声をテキスト化したデータ、モーションを取り出してディープラーニングで特徴量を抽出。その後、機械学習で評価することで、同じ意味の単語の表現が別の言葉になって揺れていてわかりにくいなど、さまざまな指摘ができるようにした。

同社は、こうした人間を評価するAIの場合、「ロジックが弱い」「全体にわかりにくい」など、人の内面に踏み入れると、評価された側が否定しやすく、受け入れられにくいと指摘する。そのため、どのような出力、表現なら受け入れられるのかをUXデザイナーとともに検討するのが重要であると述べた。

AI人材をサポートする検定と資格

セミナーの最後では、ディープラーニング協会から、今後のAI人材についての話もあった。協会によると2020年までに4.8万人のAI人材が不足するらしい。そこでAIエンジニアを育てることが急務であるという。

同協会は、エンジニア向けの検定と資格として、ジェネラリスト向けの「G検定」とエンジニア向けの「E資格」を実施している。こうした検定・資格は、取得したい資格ランキングの上位に入ってきており、実際、就活のために取得するレースも増えてきているという。
資格をとった人だけが入れる「CDLE」というAI人材コミュニティがあり、ハッカソンやミートアップ、コンテスト参加など、現在、AI人材のコミュニティとして役立っていることも触れられた。
将来的にG検定は10万人、E資格は3万人のレベルまで増やしたいとのことだ。

関連リンク:株式会社GDEPアドバンス (https://www.gdep.co.jp

Previous

QRはもう古い?「タッチレス」の現状

パーソナルメディア、リアルタイムOSで組込み機器の開発をマスターできる実習付き教材セットを発売

Next