昨今、人の状態や行動に関する多種多様なデータが蓄積されているが、観測コストやプライバシ保護などの観点から、網羅的なデータ収集が困難であり、データの活用が難しい場面が存在している。
こうした中、日本電信電話株式会社(以下、NTT)は、バラバラなデータから深層学習を用いて入出力の関係を表す関数を推定する新たなデータ分析手法を実現した。
この手法では、対応関係の失われたデータを分析するために、「万能近似能力」を持つ深層学習を活用し、任意の関数を推定することが可能だ。これにより、非線形な関数を推定しデータを分析できるようになった。
この技術のポイントは、対応関係の失われたデータから回帰関数を推定するためには、入力と出力の対応関係である確率の高い候補の集合を効率的に生成し、目的関数を近似することだ。
NTTでは、確率の高い候補の集合が要素の大小順序の並べ替え操作等により得られることを示し、各候補が実際の対応関係である確率で重み付けすることで、近似的な目的関数を導くことに成功した。
もうひとつのポイントは、目的関数の最小化に、ニューラルネットワークのパラメタ推定に広く利用される確率的勾配法を利用した点だ。これにより、パラメタ数が多いニューラルネットワークであっても、局所解に陥ることを防ぎ、より優れた解へ到達することが可能になった。
この手法を用いることで、異なる部署や組織で収集されたデータや、個人が識別できない集団単位で収集されたデータからも、入出力の関係を表す関数を推定し、データ分析が可能だ。
NTTは今後も、データ分析の適用領域拡大に向けて、データに偏りや個人差があるなどより現実的な場面におけるヒトを対象としたデータ分析を実現する手法の確立と、応用の検討を進めるとしている。
なおこの成果は、2024年2月20日から27日にかけて、カナダ・バンクーバーで開催される人工知能分野の最高峰国際会議「38th AAAI Conference on Artificial Intelligence(AAAI 2024)」で発表された。
無料メルマガ会員に登録しませんか?
![IoTNEWS](https://iotnews.jp/wp-content/uploads/2020/02/logo_square_512.png)
IoTに関する様々な情報を取材し、皆様にお届けいたします。