AWS re:Invent2017から、八子氏と共に世界の潮流と今後のIoT/AIを考える ー八子氏はアールジーン社外取締役に就任

先週、AWSの年次イベントre:Inventに参加した。基本的には技術者向けのイベントなので、ビジネス要素は少ないが、アマゾンという会社が「顧客の要求に徹底的に向き合う」という姿勢をとっていることから、このイベントでの発表を見ることで、この一年に顧客にどういうニーズがあり、それをどのように解決してきたかがわかる。

IoTにおいて語るべき重要な観点は様々あるが、今回IoTに関係する方が気にするべき重要なポイントは、エッジ側に寄せたコンピューティングへの対応と、AI、特に静止画・動画の処理と、音声の処理への対応といったところだろう。

今回、実際に現地を取材も行ったが、さらに見識のある方のご意見を伺うべく、ウフル IoTイノベーションセンター所長の八子氏と対談する機会を得たので、対談の様子も公開する。

ウフル IoTイノベーションセンター所長 八子氏 x IoTNEWS 小泉の対談

re:Inventの会場で見てきた様々なことから、IoT/AIを考える上で重要なエッセンスについて、株式会社ウフル 専務執行役員/IoTイノベーションセンター所長兼エグゼクティブコンサルタント の八子知礼氏との対談を行った。

なお、八子氏は、この度、IoTNEWSを提供する株式会社アールジーン(東京都渋谷区、代表取締役 小泉耕二)の社外取締役にも就任した。

今後、IoTNEWSは、より広範囲かつ高度な知見のもと知見の提供をしていきたい。

八子知礼氏からのメッセージ

今回、IoT Newsを発行する株式会社アールジーンの社外取締役に着任します、八子です。

IoT Newsとはウェブ記事が発刊される前のTwitterアカウントの試験段階より偶然発見してフォロワー第1号になった記念のユーザーで、それ以来小泉代表ふくめて様々な企画やイベントなどをご一緒してきました。

今回社外取締役として就任することで、所属企業ウフルの八子というよりも、より広範なIoTやAI、デジタル時代のビジネスを立ち上げていく業界全体に貢献すべく、様々な企画やイベントをアールジーン社のメンバーと推進すると共に、新しい日本の目指すべき姿をニュートラルな立場で発信していきたいと考えておりますます。

手始めに、小泉代表とのその時の旬な話題を取り上げた動画対談記事を定期的に提供していきます。また、1月末にはセミナーも企画しております。今後の活動にさらなるご理解とご期待を頂けますとなお幸いです。よろしくお願いします。

八子知礼

re:Invent2017からIoT/AIの未来を考える対談(17分15秒の動画)

なお、この動画は、12/5に限り無料で視聴できるが、12/6以降はPremium Memberのみの視聴となる。
(12/6以降パスワードは、プレミアムメンバー記事内に記載します)

この動画の内容を含めた、今後のIoT/AIに関する解説を以下行っていく。また、AWSのエバンジェリストにも直接聞いたここだけの話や、他社製品との比較も掲載する。

動画のパスワードは、「Mm724vPa」です。

AWSが考えるエッジコンピューティング

例えばショッピングモール全体に複数のインターネットカメラを設置して、来場者の動向を見ようといった時をイメージしてほしい。もともとインターネットカメラ自体はそれほどインテリジェントではない。

来場者が「男性なのか」「女性なのか」「年齢はどれくらいなのか」などを知りたい場合、取得した動画データをすべてクラウドにアップロードすればもちろん解析は可能だ。

しかし、データ量が大きくなるのと、通信量が大きくなることから、この手のことがやりたい場合は、カメラの処理で顔を認識し、特徴量を抽出するようにしたいものだ。

オムロンがすでに発売している、「OKAO® Vision」は、カメラ側でこういった人物の特徴抽出を行うことで、10種類の顔認識を行ってくれる。

このエッジ側の処理を行うと、クラウドにアップロードするデータは特徴量となる数値データとなるので、圧倒的にデータ量が少なくなる。

しかし、このカメラ、一旦導入した後、「学習済みの画像解析AIモデル」や「アルゴリズム」を変えたいと言った場合、どう考えたら良いのだろう。

はじめは、「男性か女性かを識別して統計を取っていただけ」のサービスだったが、「男性の場合には入り口のデジタルサイネージを男性向け商品にし、女性の場合は女性用の商品にする」という機能を追加するとしよう。その場合、カメラ側にプログラム更新の機能を実装しておかなければ、簡単には更新することができない。

ましてや、複数台のカメラを設置したい場合、それぞれのカメラの設置場所や、設置日、プログラムのバージョンなど、デバイスの状況管理が必須となる。

1台のカメラに対するアップデートプログラムは大したことがなくても、複数のカメラや他のデバイスなどを一気に管理するのは簡単なプログラムではない。

AWSは、今回の更新でこういった、デバイスの管理と、プログラムの管理を一元的にやってくれるプラットフォームとなったというのだ。

昨年のre:Inventでは、AWS IoT CoreとよばれるIoTデバイスからのデータ処理を行えるプラットフォームに加えて、エッジ側の処理も行えるGreengrassが発表されたが、今年は、そのデバイス資産の管理や、エッジ側でのマシンラーニングの対応機能がついたことから、具体的な顧客ニーズとしてもこういった内容が増えてきているのだろう。

AWSのエバンジェリストに、具体的なGreengrassの導入企業数やデバイス数を聞いたところ、「人気がある」としか言ってくれなかったことから、まだテストテスト的に使っているような状況なのかもしれない。

予知保全でも使えるエッジコンピューティング

ここで、工場のIoTで予知保全を例にとる。

予知保全では、機械学習によって学習済みのモデルを使って、モーターの異常などを検知するものだが、モーターの振動データを処理する場合、クラウドにアップロードして大きなリソースをつかった処理を行うか、工場内に別のマシンを置いて処理を行うかどちらかをする必要があった。

しかし、クラウドの場合、モーターから高速かつ大量にでるデータを常時ストリーミングデータとしてアップロードするのは難しいから、定期的にアップロードするという処理になる。また、工場内のマシンの場合は、そのコンピュータが、外部にネットワークが繋がっている場合が少ない。

しかし、Greengrassをつかって、工場内の小型PCにマシンラーニングの処理をデプロイすることができるのであれば、予知保全処理そのものはエッジで行い、学習するときや、学習済みモジュールをデプロイする時だけモバイルネットワークなどを利用してモジュールの改善を行うということが可能となるだろう。

IoTプラットフォームは、エッジが主役となる時代に

IoTでは小さいデータがセンシングされて、すべてクラウドに上がるといわれてきた。確かに、温度や湿度といったデータを集めたいなら、そういう構造になるだろう。

一方で、小さいデータを大量に集めることによるメリットはたいていの場合「可視化」となる。

センサーから集めた大量のデータを使って、「集めたデータを外部企業に販売する」「集めたデータに基づいてエッジ側に何らかの動作を指示する」といったことをやらなければ、本来IoTの系として成立しない。

しかし、クラウド側は比較的準備が整ってきていて、ここまでの機能でもIaaSとしては十分使えるレベルになってきていると感じた。

一方で、エッジコンピューティングについては、その限りではなく、まだまだこれから機能改善や充実が求められることだろう。

マイコンチップ用OSまで販売

そして、驚いたのは、FreeRTOSというマイコン用OSをリリースしたことだ。さらに、チップセットも販売あるようで、Amazon FreeRTOSのハードウェアパートナーはテキサス・インスツルメンツ(TI)、マイクロチップ・テクノロジー、NXPセミコンダクターズ、STマイクロエレクトロニクスの4社があがった。

このマイコン用のOSがあることで、小さなセンサー類を作るときにこのOSを使うと、デバイスのモジュールアップデートやセキュリティ対策もスムーズに行われる。

つまり、エッジヘビーなデバイスについては、Greengrassを使えば良いし、なんならGreengrassには今回のアップデートで機械学習モジュールも入れられるようになった。小さいエッジデバイスについてはマイコンチップとその上で動作保証されているOSを提供して、すべてAWS IoT Coreに接続できるし、モジュールの更新や、セキュリティ管理などIoTにおけるデバイスの必須管理項目について実現できてるのだ。

今回発表があった、FreeRTOSと呼ばれるマイコン用の軽量OSだが、Microsoftは、「Windows10 IoT」という製品をすでに出していて、対応チップセットもたくさん存在する。

AWSでクラウド環境をすでに使っている企業にとっては朗報と言えるが、製造業はじめとしたM2Mの業界におけるシェアはMicrosoftが決して見劣りをするものでもなく、両者の戦いは激しさを増すことと思われる。(今のところ、どちらが勝つとは言えない)

音声認識エンジンの今と可能性

Amazon Echoに端を発する、Amazonの音声認識エンジンは「音声を聞き取り、テキストに直す」「意味理解をする」「処理をする」「音声で応答する」などの流れで利用されるのだが、これまでもAWS上で、LexやPollyと呼ばれるモジュールでこれらを実現してきた。

しかし、これまではテキストに直すといっても、あらかじめ想定されているテキストにしか対応できなかった。そこで、Amazon Transcribeというただテキストに起こすだけでなく、文法的に正しい文書を起こすサービスを発表したのだ。

Transcribeのすごいところはすでに6ヶ国語に対応していて(例によって日本語未対応)、電話の音声にも対応している点だ。

会話が聞き取れるなら、電話の音は聞き取れるのではないかと思うかもしれないが、実は、電話の音声は実は、人と会話している時の音声とは実は異なっている。同じ波形処理では認識することが難しいのだ。

そして、電話が強調されている以上、利用シーンはコールセンターだと想像がつく。

これまでの自然言語対話エンジンは主にテキストベースであったため、チャットボットのような利用シーンだけに対応していた。

だけといっても、かなりのウェブサイトでチャットボットによる問い合わせが一般化してきている中、AWSの環境内でこれが出来ること自体は意味がある。

しかも、電話でのコールセンター業務の大半が同じ質問に対する回答であることを考えると、音声の情報を正しい文法のテキストに起こしてくれれば、あとは従来のチャットボットにつなぐだけで回答は作れる。

回答は一旦テキストで作られるが、さらにPollyを通して音声に変換すれば、電話口にはあたかもそこに人がいるかのような音声ベースでのコールセンターが簡単に構築できるのだ。
(当然、回答のためのアルゴリズムは自作する必要がある)

Amazon Echoで培った言語処理を余すことなくAWSに持ってきて再販するというビジネスモデルは、IBMやGoogle, Microsoftでは難しいのだろうと思う。

というのも、様々な自然言語のパターンを機械学習することによって鍛えられるこの人工知能は、利用者が多い方が圧倒的に有利だからだ。

イベント全体を振り返って、今後のIoT/AIの展望

今回、全体を通して、「MicrosoftができることにAmazonが追いついてきた」という印象を感じた。

また、今回の発表によって、IoTプラットフォームのうち、「デバイスの管理ができる」「デバイスとのセキュアな通信を実現する」「デバイスにリッチな処理を実現する」「音声による自然言語を処理する」というあたりを追求するプラットフォーマーは詳しくAWSのできることを調べる必要が出てきた。

そして、この先に何があるのか?ということだが、Amazonは常に顧客の要望に応えていくという姿勢をとることを考えると、来年に向けてこれらの機能を使った具体的な事例を量産し、利用シーンに応じたさらに細かな機能アップデートを行ってくるだろう。

今回の発表でも、画像処理のできる人工知能を搭載したカメラデバイスを発表していて、簡単に開発が試せるようになったが、来年は開発者向けAmazon Echoなんかを出してくるのかもしれない。

そして、IoTやAIをビジネスに取り込もうとする企業からすると、これらの機能の組み合わせで安価にシステムを構築してくれる企業が増えてくることが想定されるので、これまで手の届かな方高度な処理が自分のビジネスに取り込める可能性が増えてくる。

さらに、クラウド側とエッジ側が分断されていたが、すでにAWS上でサービスを提供している企業が多い中、これでこれまでのビジネスの延長線上でも、高度なサービスが作りやすくなったと言えるだろう。

これらのことから、来年は、インテリジェントなスマートホームや、法人企業でのインテリジェントなコールセンターのサービス、ラジオのような音声を使ったサービスのText to Speech化といった音声を活用した商品やサービスがたくさん生まれる可能性が高いと言える。

また、手が汚れている、両手がふさがっているといったシーンで、これまで作業を中断して機械を動かしていた様なシーンでは、作業中に音声で指示をするといったシーンもでてくるだろう。

Previous

ソフトバンクとSoC開発のInuitive、AI・IoT分野で協業

日産自動車とDeNA、無人運転の交通サービス「Easy Ride」を発表、一般モニターが参加できる実証実験を開始

Next