NEC、少量の収集データで活用可能な機械学習技術を開発

NECは、機械学習技術で必要とされる大量のデータが得られない状況でも活用可能な、複数の機械学習技術を開発した。

近年、インターネット上に公開された豊富な画像等のデータに対して、ディープラーニングを代表とする機械学習技術が大きな効果を発揮し、様々な用途で活用されている。

しかし、データ収集の初期段階や、データ収集コストが高い環境のように学習データが大量に得られない状況では、これまでの機械学習技術はその効果を十分に発揮できないという課題があった。

特徴1：専門知識を持つ人のノウハウを取り入れて、学習効率の高いデータを能動的に収集

実世界で起こる状況を把握するためのフィールド調査を行うには、データ収集に大きなコストがかかるため、より少ない実験回数で学習することが求められる。

同技術は、業務や領域での専門知識を持つ人の物事の因果関係に関するノウハウ(肥料の成分と植物の育成の関係、等)を数値化して活用。これにより、学習効率の高いデータを能動的に収集し学習を行えるので、より少ない収集データで学習することが可能となり、データ収集コストを下げることができる。

複雑なシミュレーションを行うには多数のシミュレーションパラメータが必要で、実データに合わせて正しくパラメータを調整する必要がある。しかし、実データが少なく、初期パラメータの見当がつかないと、従来の技術では実データに合うようなパラメータを推定できず、正確なシミュレーションが行えなかった。

同技術では、パラメータ値の異なる複数のシミュレーション結果の類似度に基づいたパラメータ値の修正を繰り返して、正しいパラメータ値を推定する。

効率的な資産配分の決定など、データから学習した結果に基づいて人の意思決定を支援することが期待される。しかし、学習データが少ないと、意思決定による効果を大きめに見積もってしまうという課題があった。

同技術は、収集したデータを学習用と効果評価用に複数の分割パターンを準備し、それぞれの効果評価結果を平均して、より正確な効果を見積もる。これにより、少数データの偏りに影響されにくく、より正しい意思決定ができるようになる。

なお、これらの成果の一部は、NEC-産総研人工知能連携研究室、国立情報学研究所、科学技術振興機構、統計数理研究所、Max Planck Institute for Intelligent Systemsとのオープンイノベーションによって得られた成果となる。

膨大な記事を効率よくチェック！

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

IoTに関する様々な情報を取材し、皆様にお届けいたします。