サイトアイコン IoTNEWS

NEC、多種多様なデータの意味を推定するAI技術「データ意味理解技術」を開発

NEC、多種多様なデータの意味を推定するAI技術「データ意味理解技術」を開発

近年、データ流通基盤や情報銀行など、データを部門間、企業間、さらには業界間で共有し統合することで、横断的な分析を行う取り組みが活発になっている。保有者の異なるデータを横断的に分析するには、表名や列名が統一されていない多様なデータを結合することが必要である。

実際、作業者、企業、業界毎の違いから表名/列名には大きな表記揺れが存在する。そのため、これまではデータ管理の専門家が膨大な量の表データを精査し、何のための表データか、その表データの各行や列が何を表しているかを見極め、人手で統合を行っていた。その結果、データ統合に膨大な時間がかかり、分析がすぐに開始できない、担当者ごとのスキルにばらつきが出て分析精度が悪化するなどの問題が顕在化していた。

日本電気株式会社(以下、NEC)は、多種多様なデータの本質的な意味をAIで推定する「データ意味理解技術」を開発した。

同技術は従来、専門家が非常に時間をかけて行っていた分野や業種の異なる複数の表データの統合作業を自動化するものである。表データの構造と数値特性を含む、様々な単語のナレッジグラフ(※1)を活用した独自の機械学習技術で、NECのAI技術群「NEC the WISE」の1つだ。同技術の詳しい特長は以下の通り。

なお、同技術をオープンデータ(※2)に適用したところ、専門家が30日かけていたデータ統合作業を、1時間で同等品質にて実現することを確認した。

今後NECは、同技術をサプライチェーンに加え、データレイクといわれる様々な分野の形式の異なるデータが集まるデータベースや、データを一元管理するDMP(※3)、情報銀行やデータ流通プラットフォームなど情報共有基盤への汎用的な活用を目指し、研究開発を進める方針だ。

※1 様々な単語の意味をネットワークで表現したデータベース。
※2 公開されているセンサ情報や医療情報など多業種のデータを使用。
※3 Data Management Platform(データ マネジメント プラットフォーム)の略。別々に管理されている情報データをまとめて管理するためのプラットフォーム。

モバイルバージョンを終了