『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

PR

データセットの取り込み

まずはDIGITSを起動し、データセットを取り込む。
DIGITSは、「DeepLearning BOX」のデスクトップにあるショートカットをダブルクリックすれば起動する。
起動すると、自動的にブラウザーが立ち上がり、DIGITSのトップページが表示される。
ここから、まずDataSetsのタブを開き、新しいデータセットを作成する。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

データセットの取り込みはバッチ処理で行なわれており、しばらくしてから、DIGITSのDataSetのジョブを確認すると、およそ30秒程度で取り込みが終わっていることが確認できる。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

作成したデータセットは、DIGITSのDataSetsから確認することができる。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

セマンティック・セグメンテーションを行なうモデルの作成

ここまでの流れを整理すると、セマンティック・セグメンテーションでは、画像データから「対象物の抽出」と「対象物が何であるか」を識別するため、その学習データとして、2GBの画像データとラベルデータを取り込んだ。

次の作業はモデルの学習だが、こちらもDIGITSのWebインターフェイスから設定・実行することができる。

モデルの作成は、DIGITSのインターフェイスから必要となる項目の設定や深層学習で使うニューラルネットワーク※のトポロジーをJSON形式のテキストで指定することができる。

ニューラルネットワークとは

ニューラルネットワークとは、人間の脳の仕組みであるニューロンからヒントを得て数理モデル化したものを指す。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

ちなみにこの式のxは入力値、wが重み付け、bがバイアスとなり、これらのパラメータの内容で0または1と判定できるようパラメータを調整する。
複数の入力を受け判定をするこのようなアルゴリズムを「パーセプトロン」と呼び、ニューラルネットワークの起源となった考え方である。
このニューロンを模した個々の数式をつなぎ合わせ、何層にもなる階層を作り、つなぎ合わせた演算結果から入力を判定することから、これらをニューラルネットワークと呼ぶ。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

モデルの作成

それでは実際にモデルの作成しよう。
DIGITSのHome画面からModelsに切り替え、新しいモデルを作成すると、以下のような画面に遷移する。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

前回作成した「PASCAL VOC2012」のデータセットを選択し、必要なパラメータを入力する。
中でもニューラルネットワークのトポロジーを指定すると、視覚化して内容を確認することができる。

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

パラメータの入力が終わったら、モデルのトレーニングを開始しよう。

次ページ:モデルのトレーニング