米ナスダックと東証マザーズに上場し、人工知能を駆使したビッグデータ解析事業を手がけるUBICは、人工知能の成長を可視化することに成功、人工知能の成長過程を視覚的に把握し、テキスト解析の精度を効率的に向上するコンサルティングサービスの提供を開始すると発表した。
UBICは、人工知能によるEメール自動監査システム「Lit i View EMAIL AUDITOR(以下、EMAIL AUDITOR)」により、企業内の大量のメールを自動的に監査し、企業のお客様が防ぎたいリスクを発見するソリューションを提供している。
「EMAIL AUDITOR」に搭載された人工知能「バーチャルデータサイエンティスト(以下、VDS)」は、豊富な経験をもつ監査人(社内外の監査スタッフや弁護士など)から、不正を判断する特徴を学び、監査人がすべてチェックすることが不可能な大量の電子メールのテキストから、情報漏洩やカルテルなど不正行為への関与の疑いがあるコミュニケーションや行動を、監査人に代わって見つけ出す。
成長を可視化するコンサルティングサービスは、「EMAIL AUDITOR」の導入を始めたお客様より“人工知能によるメール監査がどの程度機能しているのか?”、“運用開始からどれぐらいの期間で実用的な監査ツールとして稼動できるのか?”などを知りたいという要望に応えるために開発された。
従来は表の一覧で示していた解析結果を、グラフ上でのメール文書の分布、時系列での推移を見ることで、より分かりやすく確認できるようになった。今後、「EMAIL AUDITOR」を導入するお客様に対するコンサルティングサービスとして提供される。
成長を測定するポイントは、監査人が「不正に“関連する”と判断した文書」と「不正に“関連していない”と判断した文書」が、人工知能によって正しくスコア付けされているかどうか、で判断。監査人が関連性の有無を判断したメール文書が全体のどの位置に分布し、時系列でスコア付けがどう変わるかという動きを追うことで、人工知能の成長度を測ることができる。
人工知能の成長プロセスは、1.成長初期 2.成長期 3.成熟期 の3つの段階に分けることができる。成熟期に到達すると、安定したメール監査機能として稼働が確認できたことになる。
成長段階における分布の変化(典型的なサンプルと実際の案件での文書分布比較)
下記の図は、人工知能の各成長段階における典型的なサンプルと、ある実際の案件におけるメール文書の分布を並べたものだ。
典型的なサンプルと実際の案件を比較し、同様の傾向があらわれているか見ることで、実際の案件において人工知能が正しく稼働しているかどうか確認できる。
グラフの横軸には最新のスコア付け、縦軸には1つ前の解析時のスコア付けを取ることで時系列での変化をみることができる。
図1:成長初期
運用初期の段階で典型的なサンプルは、監査人が「不正に関連する」と判断したメールであっても、人工知能は低いスコアを付けるなど、監査人の判断と人工知能のスコアに乖離があり、全体的にスコアのばらつきが発生する。
実際の案件(運用開始時→10日目)でも同様にばらつきが発生しており、判断の学習が十分でない状態が見られている。
図2:成長期
学習期間を経ると、監査人が不正に関連すると判断したメールについて、高いスコアが付く件数が増加するため、典型的なサンプルでは、「関連あり」の分布は「過去のスコアが低く、現在のスコアが高い」ことを意味する右下のゾーンに移動する。
また逆に、「関連なし」の分布が「過去のスコアが高く、現在のスコアが低い」ゾーンに移動する傾向も発生。
実際の案件(17日後→24日後)では、関連ありのスコアの値が高まっており、人工知能が適切に成長していることが分かる。
図3:成熟期
さらに学習期間を経ると、典型的なモデルと実際の案件(同 24日後→59日後)のどちらも、監査人が関連すると判断したメールは高いスコアに集中し、関連なしと判断したメールについては低いスコアに集中する。
グラフ中の成長基準線付近に集中した状態は人工知能の学習が理想的に進んだことを意味し、人工知能が成熟した状態を表している。
注)成長の日数は1つの例であり、案件ごとによって異なる。
UBICでは、高度情報解析課においてVDSの学習機能が適切に働いているか、分析コンサルティングを行っている。
今回の可視化の手法は、UBICの高度情報解析課の彦根佑紀主任による分析作業の中で発見された傾向や手法を元に開発されている。
可視化の手法を用いることによって、従来よりも、より直感的に人工知能の成長過程を把握することが可能になり、成長の精度やスピードが適正であるかどうかを容易に判断することができる。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。