「AIをどうにかしろ」と上司に言われたときに、最低限知っておくべきこと[Premium]

AIセミナーでAIの基本的なことを教えてほしいといわれることが多い。それで、一通りの「AIの歴史」や、「なぜAIが取りだたされているのか」「AIでできること」などなどを説明するのだが、冒頭、「なぜAIの話を聞きたいと思ったのか?」と聞くと大抵の方は、経営者や上司が「AIについて勉強してきて、なにかうちでも使え」と言ってきたからだという。

AIと言われても、どういうことができるのか簡単に説明できないし、自社のビジネスのどこにAIが使えるのかも想像がつかない。

そこで、今回は、上司や経営層に「AIでどうにかしろ」と言われたときに知っておくべきポイントを解説する。

AIは魔法の杖なのか?

そもそも、AIが魔法の杖だ、なにかすごいことができる新しい手法だ、と思っている人は今すぐ考え直した方がよい。

AIと呼ばれるものの定義は、いわゆる「人工知能」を追いかけてきた学者先生にとっては、「脳の仕組みを数式で置き換えること」なのだが、多くの産業向けでの利用を考えている人にとっては、「これまでのアルゴリズムでは解決することができなかったことを解決することができるモノ」という認識が多いだろう。

皆さんの言う、解決することができる「モノ」とは、どういうモノなのだろう。

まずAIというのは「学習モデル」というものが必要になる。

例えば、写真を見せて、「犬」か「猫」かを仕分けるための画像認識AIを作るとすると、初めにやることは犬や猫の写真をたくさん準備して、犬と猫を識別できるモノを作る必要がある。

初めにここに大きな勘違いがあって、そんなものはなくても、「AI」というモノを買ってくれば(あるいは作れば)、犬と猫を識別できると思い込んでいる人が案外多いのだ。

そして、この犬と猫を識別することができる「モノ」ができたら、次に別の写真をこのAIに見せる。そうした時に初めて、その写真に写っている動物が90%猫だ、とか85%犬だといったような感じで、識別されるのだ。

つまり、AIといっても実態はただの複雑な数式で、中学校くらいの時に、「y=Ax+B」的な数式を学んだことがあるだろうが、そんな感じなのだ。

もちろん、実際はこんな簡単な数式では表せないことがほとんどだが、yが1なら犬、yが0なら猫といった具合に判定を行う。ここで、0.1なら猫っぽいと判定するのだ。ここで、この例の場合、xに当たる変数が動物の写真ということになる。

この式でAやBによって直線の傾きなどが変わることはご理解いただけると思うが、そのAとかBの値がより正確に犬か猫かを決める変数となる。

つまり、多くのデータを学習させるということは、次の1枚の画像を見たときになるべく正確に犬か猫かを識別するための変数や定数を導きだす作業なのだと理解すればよいのだ。

AIの学習フェーズではデータ量が勝負となる

よく、IoTやAIのセミナーに参加すると、「データをたくさん準備する必要がある」といわれる。

前項が理解できた方には当たり前と思えるだろう。数式を鍛えるには多くのパターンに対応した数式を導き出す必要があるからだ。

しかし、データはなんでもいいのだろうか?

犬か猫かを識別するには、大量の犬と猫の写真を準備する必要がある。ここまでは理解できるだろう。

では、鳴き声は準備しなくてよいのだろうか、体の大きさは知らなくてよいのだろうか。

生物界にはほぼ同じ形の生き物だが体長が違うというものもいる。例えば、先日話題になった「ヒアリ」だ。

ヒアリには、とても似たアリで、体長がヒアリに比べてとても大きなアリがいる。(検索すると似たアリが他にも沢山いることがわかる)

こういう違いを見つけたい場合は、学習用のデータには、例えばヒアリの近くに米粒があるなど、学習用データにサイズの違いがわかるものが画像に写っている必要がある。

つまり、学習させるべき内容が適切でない状態で作られた学習モデルは、新しいデータを投入した際に間違った結果を出す恐れもあるのだ。

では、我々がAIを作らなければいけないと思ったときにどういうデータが必要だといえるのだろう。

初めの段階では、「おそらく」正しい学習モデルを作ることができるデータを準備するしかないのだ。

そして、作ってみた学習モデルを使って、何度も施行実験を繰り返し、精度を試すのだ。

作ったモデルがダメだった場合にどうするのか?

このやり方だと、一度に精度の良い回答をする学習モデルが作れない可能性があることに気づいただろうか?

モデルがダメだった場合の原因は、

  • パラメータ選びが間違っていた(ヒアリの例だと体長を学習させていなかった)
  • モデルを作る際に用いる数式が間違っていた(y=Ax+Bなどという単純な数式では解決できなかった)
  • データが不足していた(学習モデルを少ないデータ量から作ろうとした)
  • などが考えられる。データが多くないといけないという話は実は上の3番目にしか着目していないことがわかるだろう。

    つまり、もし、AIで解決できそうなことがあったとしても、本当にAIを使って思った結果に至るかどうかについては、何度もモデルを作り直してみないとわからないということになるのだ。

    すぐ使えるAI、すぐ使えないAI

    導入を考えている企業からすれば、これはたまったものではない。

    AIを導入するということは、いくらかかるかも、どれくらいの期間がかかるかもわからないからだ。

    しかし、実はすぐ使えるAIは存在している。

    例えば、画像認識の技術だ。画像認識は、すでに人間の認識レベルを超えているといわれており、マイクロソフトやGoogleがモジュールを提供していて、これを借りて使うだけで実現できる。

    一方で、まったくノウハウが確立されていない領域のAIをゼロからつくるのは、データの選定からして大変だといえる。

    そういう意味では、すでにできているAIを見極めるには、

  • どういうデータを使って学習したのか
  • どれくらいのデータ量を学習したのか
  • どんな数式で構成されているのか
  •  
    といったことをヒヤリングし、妥当性を判断しつつテストデータを投入して、思った結果が得られるかを見るのが妥当なやり方だといえる。

    業務レベルでAIを導入する際の問題

    例えば、工場の産業機械にセンサーを付け、センサーのデータを監視し、故障を未然に予知するという、いわゆる「予知保全」をしようということになるとする。

    こういう単純なケースの場合、例えば振動がわかる加速度センサーであれば、xyz軸と、それぞれの回転軸を取得することができる6軸加速度センサーを使えば、もれなく振動は収集することができるし、実際の産業機器の振動の周波数が加速度センサーのそれとあっていれば、振動を漏らすことはない。

    なので、振動に関する予知保全の学習モデル(AI)があれば、それをもってきて使うことで学習の手間をずいぶん減らすことができる可能性がある。

    しかし、例えば需要予測のような複合的な要素で決定するようなことに対するAIを作る場合、そもそもどの要素が売れ行きを決定づけるかがわからないはずだ。

    例えば、清涼飲料水メーカーは、毎年夏になる前に、気温の予測データや暦年の売り上げ状態から、今年の生産個数を予測するのだが、かなりの確率でずれが出てしまう。これは、例えば類似商品が他のメーカーから投入されたり、大手の流通がプライベートブランドをリリースしてしまったため、棚割りを狭くしてしまうといったことが起きえるからだ。

    こう考えていくと、複雑な要素を複合的に加味するようなAIの場合、決して簡単にはそのモデルを作ることができないのだということに気づくだろう。

    「AIをどうにかしろ」と言われたら

    では、上司から「AIをどうにかしろ」と言われたらどうしたらよいのだろうか。

    まず、AIによって予測や識別をしたいことが何なのかを明確にした方がよい。

    そして、予測や識別したいことが、画像で判断できるようなことや、そもそもパラメーターが少ないようなことであれば、概ね手間なくできると考えられる。(もしかしたら、AIというほどではない、既存の確率統計処理でさばけるものもあるのだ)

    パラメータが多い、もしくは、取得できるデータが少ないといった場合で、かつ実績のあるAIが存在しない場合は、ゼロから作ることになるので、いくらかかるとも、どれくらいかかるとも、なんとも言えないと考えるべきだ。と答えよう。

     
    実績のあるAIが存在するのかどうかについて、身近に相談する相手がいないということであれば、ぜひお問い合わせフォームから連絡をしてほしい。

    ご質問・お問い合わせ

    この内容に関するご質問・お問い合わせはご気軽にご連絡ください。

    [contact-form-7 404 "Not Found"]
    Previous

    中部電力・KDDI・豊田市がLPWAを活用した「児童の見守りサービス」の実証実験を開始

    日立システムズ、OTやIoTにも対応するセキュリティオペレーションセンター「SHIELD 統合SOC」を開設

    Next