NEC、少量の収集データで活用可能な機械学習技術を開発

NECは、機械学習技術で必要とされる大量のデータが得られない状況でも活用可能な、複数の機械学習技術を開発した。

近年、インターネット上に公開された豊富な画像等のデータに対して、ディープラーニングを代表とする機械学習技術が大きな効果を発揮し、様々な用途で活用されている。

しかし、データ収集の初期段階や、データ収集コストが高い環境のように学習データが大量に得られない状況では、これまでの機械学習技術はその効果を十分に発揮できないという課題があった。

特徴1:専門知識を持つ人のノウハウを取り入れて、学習効率の高いデータを能動的に収集

実世界で起こる状況を把握するためのフィールド調査を行うには、データ収集に大きなコストがかかるため、より少ない実験回数で学習することが求められる。

同技術は、業務や領域での専門知識を持つ人の物事の因果関係に関するノウハウ(肥料の成分と植物の育成の関係、等)を数値化して活用。これにより、学習効率の高いデータを能動的に収集し学習を行えるので、より少ない収集データで学習することが可能となり、データ収集コストを下げることができる。

特徴2:複数シミュレーション結果の類似度に基づいてパラメータ修正を繰り返すことにより正確なシミュレーションパラメータを推定

複雑なシミュレーションを行うには多数のシミュレーションパラメータが必要で、実データに合わせて正しくパラメータを調整する必要がある。しかし、実データが少なく、初期パラメータの見当がつかないと、従来の技術では実データに合うようなパラメータを推定できず、正確なシミュレーションが行えなかった。

同技術では、パラメータ値の異なる複数のシミュレーション結果の類似度に基づいたパラメータ値の修正を繰り返して、正しいパラメータ値を推定する。

特徴3:AIの分析結果に基づく意思決定時に、少数データの偏りに影響されにくい意思決定が可能な学習

効率的な資産配分の決定など、データから学習した結果に基づいて人の意思決定を支援することが期待される。しかし、学習データが少ないと、意思決定による効果を大きめに見積もってしまうという課題があった。

同技術は、収集したデータを学習用と効果評価用に複数の分割パターンを準備し、それぞれの効果評価結果を平均して、より正確な効果を見積もる。これにより、少数データの偏りに影響されにくく、より正しい意思決定ができるようになる。

なお、これらの成果の一部は、NEC-産総研人工知能連携研究室、国立情報学研究所、科学技術振興機構、統計数理研究所、Max Planck Institute for Intelligent Systemsとのオープンイノベーションによって得られた成果となる。

Previous

IDC、2018年AR/VRヘッドセットの世界市場は前年比6%増の887万台と予測

『DeepLearning BOX』ではじめるディープラーニング② DIGITS + Caffeで画像認識

Next