東芝は3月13日、工場やプラントなどのインフラ分野で、機器の図面、仕様書、点検・トラブル記録といった専門的なデータを高い効率・精度で認識し、保守点検の効率化を実現する「文書理解AI(人工知能)」を開発したと発表した。
開発したAIは、一般用語を習得した大規模な汎用言語モデルを教師モデルとして、教師モデルからの継承(モデル蒸留)で一般用語を学習すると同時に、別カリキュラムで専門用語も学習する小規模な特化言語モデル(生徒モデル)を生成する。

具体的には、教師モデルと生徒モデルそれぞれに、複数の単語を隠した同じ専門データを入力。生徒モデルは、隠された単語の一般用語部分は教師モデルと同じ答えを出力するように学習し、隠された単語の専門用語部分では正解と同じ答えを出力するように学習を行う。生徒モデルは、一般用語と専門用語を同時に学習することで、一般用語を忘却することなく専門用語を習得できるようにした。
東芝では、電力設備の保守点検記録に記載されたトラブルの表現を見つける言語解析試験(情報抽出タスク)で、AIの有効性を検証。検証では、AIで生成する生徒モデルの計算規模は、1から学習する大規模な汎用言語モデル(従来手法)の半分、学習時に使用する文書量は、従来手法の100文の1に設定した。
試験の結果、保守点検記録の中からトラブルが発生した機器の状況を示す「現象」や機器を修理するために保守員が実施した「対策」が記載された場所を、正解率89%で抽出できることを確認した。また、1から学習する大規模な汎用言語モデル(従来手法)の学習時間の1週間程度と比べて、学習時間が5時間(約97%削減)に短縮できることを確かめた。
同社によれば、開発したAIをインフラ保守の現場に適用することで、これまでのAIでは認識が困難だった熟練者の経験や知識が蓄積された専門データを活用することが可能になるとしいう。また、過去に発生したトラブルの現象や対策などを高精度に抽出することが可能になり、インフラの事後保全の迅速化、予防保全の実現への貢献が見込めるとしている。
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。