株式会社日立製作所(以下、日立)は、賛否が分かれる議題に対し、大量の日本語記事を分析して賛成・反対双方の立場から根拠や理由を伴った意見を日本語で提示する人工知能の基礎技術を開発した。今回、記事の中から議題に対する意見の根拠や理由に該当する文を識別するプロセスにディープラーニングを用いることにより、これまで言語ごとに個別に作成する必要があった文を識別するための専用プログラムが不要となり、様々な言語の文書データを対象とした汎用システムを構築することが可能となったという。
これまで日立では、大量の英語記事を分析して、英語で意見を提示する人工知能の基礎技術が開発されてきたが、今回開発された技術を用いることにより、国内企業でニーズの高い日本語への対応が可能となる。
社会情勢が急速に変化し、顧客ニーズも多様化する中、企業は新しいサービスや価値を継続的に生み出すことが求められる。また、近年、インターネットなどの情報通信技術や分析技術の発展に伴い、日々生み出されるビッグデータを解析し、有益な知見を抽出する技術への関心が高まっている。
これまで日立は、企業の経営判断を支援することをめざし、大量の英語記事を分析して英語で意見を提示する人工知能の基礎技術を開発してきた。従来の技術では、英語特有の文法をプログラミングし、それを元に根拠や理由にあたる文を抽出していた。そのため、日本語を含む他の言語へ展開する際は、それぞれの言語に対応する専用プログラムを作成する必要があり、展開が難しいという課題があった。
そこで、ディープラーニングを用いることによって同課題を解決し、言語に依存せずに議題に対して関連性の高い根拠文・理由文を識別することを可能とした。
具体的には、数千の記事に対して、根拠や理由を表す文を抽出し、学習させることで、人工知能システムは記事から法則やパターンを自ら導き出し、根拠文・理由文を識別する。また、ニュース記事や調査報告書など文章中のどの語句に注目すべきかを推定しながら学習する、注目箇所推定機能をディープラーニングに追加したことで、議題や価値概念に関連する語句など注目すべき箇所を的確に捉えることができる。
同手法を用いることにより、言語に依存せずに議題に対して関連性の高い根拠文・理由文の識別が可能になる。
今回開発された技術は、意見を提示する人工知能システムを多言語で活用していくための基礎技術となる。今後、更なる研究開発を推進し、グローバルに企業の経営判断を支援する人工知能システムの実現をめざすという。
同成果は、2016年6月6日~9日に北九州市で開催される人工知能学会全国大会にて発表される予定。
【関連リンク】
・日立(HITACHI)
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。