新しい技術を使っても、AIエンジンは必ずしもよくならない
小泉: KIBITのアルゴリズムは、どのように進化してきているのでしょうか。
武田: KIBITのアルゴリズムの特徴は、少量のデータでも精度の高い学習モデルをつくれることです。AIがどんな未知のデータに対しても正確な判断を下せることが理想ですが、現実には微妙な判断を求められる境界線にあるデータが存在します。
より多くの種類の未知データに対応するには、より広範な特徴を学習し、カバーできる網羅性を確保しなければなりません。
しかし、特徴を広く学習しすぎると、微妙な境界にあるデータの中で、間違いを正解とみなす確率も上がってしまいます。学習する特徴を広げすぎないことも重要なのです。
その二つが両立すると完璧なAIマシンができるわけですが、普通はトレードオフの関係にあります。広く特徴を取ろうと思ったら、精度が落ちます。特徴をしぼると、網羅性が損なわれます。
少ないデータでも精度の高い学習モデルをつくれるというKIBITのメリットを損なわず、より精度を上げるために、広すぎず、せますぎず、いかに程よいデータを教師データとして学習させるか、というノウハウを強化してきました。
小泉: 自然言語処理の技術そのものは、どのように進化してきているのでしょうか。
武田: たとえば一つのトレンドとして、語と語の関係性を以前より理解できるようになってきていることがあります。
コンピュータで自然文を正しく解析する上で、それを難しくしているのは、「言葉」が固定された一つだけの意味を持つのではなく、文脈によって意味がさまざまに変わる多義性を持っているからです。
事前にデータを学習しておくことで、自動的に語と語の関係性を解析し、文脈に応じた解析が可能になってきています。
例えば、わかりやすい例として、「シノニム(類義語)」の理解があります。以前は辞書を整備することが、類義語を解析する上での手段でしたが、同じ意味で使われる言葉を、自動的に判別することができるようになってきています。
小泉: そうした新しい技術を取り込むことで、KIBIT自体の精度も向上してきているのでしょうか。
武田: はい、解析に関わるさまざまな新しい技術を取り入れ、向上しています。
一方、よく誤解されることですが、新しくできたアルゴリズムを使ったからといって、必ずしもAIエンジンのすべてがよくなるわけではありません。
さきほど、課題に応じて最適なアルゴリズムを使うことが重要だと申し上げましたが、やはりAIにとっての肝はそこにあるのです。使えるアルゴリズムのバリエーションが広がり、選択肢が増えるのはいいことですが、必ずしもすべてが一つの手法でよくなる、というわけではありません。
小泉: なるほど。第3次AIブームが到来してから、何でもかんでもディープラーニングを使おうという考え方が一時期広まったように思いますが、ディープラーニングも得意分野と苦手分野があり、万能ではありません。やはり、それぞれの課題や用途によって、必要な技術を見定めていくことが重要ということですね。
武田: おっしゃるとおりです。
小泉: KIBITのようなAI技術によって、人間でもわからないような、言葉の裏にある意味がわかるというのは、とても面白いことですよね。
武田: そうなんです。実は、「KIBIT」が学習するデータには2種類あります。「結果」と「判断」です。
「結果」とは、過去に実際に起こったことや目的に応じて、正解と不正解が明確にわかるものです。たとえば、先ほどの「離職してしまった人」などです。
一方、「判断」は、その時点では正解と不正解はわからないデータのことです。たとえば、談合や金融のケースなど、業務の専門家が状況を見て、正解と判断する場合です。
人間にとって、膨大な情報をふまえて質の高い判断を選ぶのは難しいことです。それはコンピュータの方が得意です。人間の仕事においては、「雑だけど判断の早い人」と「丁寧だけど判断の遅い人」の2パターンの人がいると私は思っています。
そもそも早い判断が苦手な人間にとって、「丁寧だけど判断の遅い人」の方が、判断を間違えない傾向にあります。だとすると、「丁寧だけど判断の遅い人」の方が、学習データとしては優秀であり、その方が将来的には生き残れる可能性が高いのではないか、などと思ったりします。
小泉: なるほど、面白いですね(笑)。
武田: 人間の仕事では、「そんな時間をかけなくていいから、早くやってほしい」ということがよくありますが、これから機械が人間の世界にますます入ってきて、何らかの判断を下すようになると、「判断の正確さ」が人間の価値として浮き彫りになってくるような気がするのです。
小泉: 貴重なお話をありがとうございました。
【関連リンク】
・KIBIT
無料メルマガ会員に登録しませんか?
技術・科学系ライター。修士(応用化学)。石油メーカー勤務を経て、2017年よりライターとして活動。科学雑誌などにも寄稿している。