画像の中から人や物を高精度に認識・判別する画像認識AIの技術は、近年急速に普及している。顔認証や自動運転などがよく知られているが、実はさまざまな用途がある。その一つが人流解析だ。駅や商店街、夏の花火大会などの混雑する場所で、カメラ映像(動画)から人の数や流れを計測・解析し、混雑を避けるための誘導やレイアウト改善に活用する。
しかし、いくらAIといえども、人があまりにも密集している場所で人流解析を行うことは容易ではない。AIで人の数や流れを計測するには、まずカメラに映っている対象が「人」かどうかを正確に判別できなければならない。しかし、密集している場所では人が重なって映っているため、その判別が難しいのだ。たとえば、上に示した写真は品川駅の港南口から高輪口へと続く東西自由通路の様子だ。これほど人が密集している場所で人流解析を行うのは至難の業である。
だが、これに成功した企業がある。大手鉄道コンサルタント会社のJR東日本コンサルタンツ株式会社だ。同社は品川駅東西自由通路などで約3年に渡り人流解析AIの学習と検証を続けてきた結果、超過密な人流を高精度に計測・解析するAI技術「Gunsyu(グンシュー)」を開発した。Gunsyuは現在、JR東日本の各駅に展開が期待されるとともに、商業施設やコンサート会場、夏の花火大会などの人が混雑する場所での人流解析AIソリューションとして幅広く提供が可能である。
AI開発の完全内製化を推進
JR東日本コンサルタンツは、JR東日本グループの大手建設コンサルタント会社として、鉄道や道路の設計・建設を手がけている。一方で近年では、IoTやAI、デジタルツインの技術開発にも注力している。特に2019年からAIの開発を本格化し、主に画像認識AI、音声認識AI、音響認識AIという三つの分野の技術を開発してきた。
画像認識AI(動画解析AI)においては、後述するGunsyuの他に「駅モニ」を提供している。駅モニは、AIがカメラ映像(動画)から駅構内のさまざまな状況を自動で検知するソリューションだ。
たとえば、車いすや白杖、ベビーカーの利用客や異変(転倒や暴力行為など)を自動検知することで、従業員が速やかに対応できる(下の画像)。駅モニを利用することで、監視業務を効率化し、駅従業員の負担を従来よりも大幅に軽減することが可能となる。駅モニは現在、都内民鉄駅で活用されており、またJR東日本管内駅での試験運用も予定されている。
音声認識AIは、人の音声データを文字に変換する技術だ。トラブル等発生時に従業員の音声のやりとりを認識して関連する事例を自動表示し、瞬時に対応するためのアプリを開発した。
音響認識AIは、新幹線の走行音を認識して異常を検知するための技術だ。新幹線の音響データと雑音(自動車の走行音など)を区別し、分析に必要な音響データだけを正確に抽出する。以前は従業員が数名現場に行き、現場の状況を確認しながら音響を測定する必要があったが、この技術を使えば、現場にマイクを1台設置するだけで分析が可能になる。
同社のAI開発の特徴は、オープンソースの活用と内製化だ。オープンソースとして公開されているAIアルゴリズムを利用することで、たえず最先端の技術を更新・実装している。
またAIの学習に必要な教師データはすべて自社で作成しており、たとえば試行段階における画像(動画)の検知状況確認や精度予測も自社内で対応することができる体制を構築している。さらには、解析もすべて同社のエンジニアが実行することで、顧客が求めるAIソリューションをスピーディーかつ比較的低コストで提供することができる。
超過密な人流をAIで可視化する新技術
Gunsyuは、カメラ映像に映っている超過密な群衆の中から、「人」を検出する技術だ。たとえば、ある時間の映像の中に含まれる人の数を計測できる。さらにそうした「点」のデータを統合して「線」にすることで、群衆の動き、つまり「人流」を可視化することができる。
そのため、まずは映像の中からいかに正確に人を検出できるかが重要となる。しかし、超過密な人流の場合は、膨大な数の人が重なって映っているため、検出が難しい。JR東日本コンサルタンツも当初はこの問題に苦労したが、試行錯誤を繰り返すことで克服した。
技術の詳細は公開できないが、簡単にいえば、同社は体の一部だけでも人だと認識できるような技術を開発した(※)。まず、少ない情報量で「人」を認識するには、高度なAIエンジンやアルゴリズムを使うことが必要だった。
さらに、AIが人や物を高精度に認識するためには、それに必要なデータを開発者が選定し、学習させなければならない。いいかえれば、AIが深層学習によって独自につくりあげる学習モデルが現実世界の状態(この場合はリアルな群衆の状態)と一致するように、人が調整していく必要があるのだ。
たとえば、Gunsyuの開発においては、多様な人物画像を検出したうえで、AIに学習させるという技術も必要だった。さらには、カメラの位置や光の当たり具合といったさまざまな現場の状況を把握し、自社で必要なデータをそろえることで、超過密な群衆でも人流を解析できる学習モデルの開発に成功したのだ。
Gunsyuの開発者は、「AIと聞くと、高度なエンジンや解析技術が重要であると思われがちです。しかし、何よりも重要なのは、実は経験やノウハウです。これは、実際に開発してみて初めて気づくことです。高度な技術があれば何でもできる、というわけではありません。AIは人が『丁寧に育てていく』ことが肝心なのです」と語る。
※Gunsyuには顔認証の技術は使われていない。そのため、画像に映っている人の顔から人物を特定することはできない。また、画像から人流解析に必要な特徴量を抽出したら、画像データ自体は削除される。以上から、Gunsyuの学習と解析においては、カメラ映像に映っている人の個人情報は守られている。
品川駅や渋谷駅で超過密人流の自動計測に成功
AIモデルの開発は、一般にはまず小さなスケールから実験的に始め、少しずつ拡張していくことが多い。しかしJR東日本コンサルタンツは、Gunsyuの開発を、品川駅東西自由通路という最難関の場所からスタートした。1時間あたりの通行者約2万人超という、超過密人流である。
しかし、解析精度を高めるさまざまな工夫を加えることにより、95%の精度を達成した。開発者は、「品川駅東西自由通路は、日本で最も人流解析が難しい場所の一つです。実際、開発には非常に苦労しました。しかし、超過密人流をAIで解析するためには、超過密人流に特有のさまざまな課題を克服しなければなりません。そのため、最難関からスタートした私たちのアプローチは正しかったと今では思っています」と語っている。
同社は、現在(2023年11月時点)線路の切替工事が行われているJR渋谷駅において、Gunsyuを用いた人流解析を実施している。これは、JR東日本・JR東日本コンサルタンツと東京大学大学院の社会連携講座「次世代鉄道研究体講座」の一環として行われているものだ。渋谷駅は工事のため通路が本来よりもせまくなっており、人が密集しがちだ(上の画像)。そうした渋谷駅の超過密人流においても、Gunsyuは約98%の解析精度を達成している。
さまざまな利用シーン:商業施設、コンサート会場、災害発生時など
Gunsyuは、必要に応じてさまざまな用途や目的で利用できる。たとえば、駅や商業施設で人流解析データを活用し、混雑しやすい場所やその原因を特定する。これにより、利用者がより使いやすい施設の設計や工事などが可能になる。また、小売店はキャンペーン前後の人流の変化を解析することで集客効果を定量的に評価したり、新規出店エリアを選定したりすることも可能だ。
あるいは、商店街や空港などの混雑状況を可視化してモニターで表示すれば、利用客は空いている場所に移動するようになるため、混雑を避けることができる。災害時には、最適な避難経路を導き、被害を最小限にとどめるということも可能だ。要するにGunsyuは、「特定の場所や条件で群衆がどのように動くのか(あるいは動きの変化)」を可視化する技術であり、そのデータの使い道は、ほとんど無数に考えられる。
さらに大きな視点で見れば、駅や大型商業施設、都市の人流データを取得することで、未来のまちづくりの構想や設計に活かすことができる。最近では、都市をデジタル上の3D空間に表示し、シミュレーションを行う「デジタルツイン」の技術が注目されている。デジタルツインの精度を向上するには、可能な限り現実世界のリアルなデータを取り入れる必要がある。
たとえば、そこで人流解析の技術を使うことで、群衆のリアルな動きにもとづき、3D空間での高精度なシミュレーションすることが可能になる。実際にJR東日本コンサルタンツでは、さまざまな駅や関連施設に設置された定点カメラの映像データとGunsyuを利用することで、10~20年先の駅や都市の計画に活用していく予定だという。
Gunsyuを使ってみよう
人流解析は、カメラ映像やAIを使わずに行う方法もある 。たとえば、群衆がもつスマートフォンのGPS機能を使った方法だ。GPS機能を使えば、人工衛星から送信される電波をスマートフォンで受信することで、位置情報を取得できる。この位置情報を追跡することで、人流が解析できるのだ。
しかし、この方法はスマートフォンのユーザーが特定のアプリを利用したり、GPSの位置情報取得を許可したりしなければ機能しない。つまり、原理的に群衆のすべての人流データを取得できるわけではないため、精度が保証されないという問題がある。その点、Gunsyuのようにカメラ映像を使う方法は、適切な位置にカメラを設置さえすれば、たえず現場のリアルな人流データを取得し、高精度な解析が可能になる。
最近では人流解析を行うAIソリューションも普及しているが、Gunsyuのように超過密人流で使えるものは多くはない。また、Gunsyuは超過密人流でも解析できることに加えて、先述のとおりオープンソースの活用と内製化を進めているため、安価に手軽に利用できるという特徴がある。
また、人流解析で高い精度を確保するためには、各計測地点で丁寧な精度検証を行ったうえで、解析を進める必要がある。現場に根差したAIソリューションであるGunsyuは、こうした精度検証も徹底して行う。
Gunsyuは、カメラの動画データさえあれば今すぐにでも利用できる。生データでも、他社のクラウドソリューションに蓄積されたデータでもよい。また、人流計測(人数のカウント)に加えて、人流の密度や速度の解析、異常検知、アラーム通知などのさまざまなタスクにも利用できる。興味をもった人は、JR東日本コンサルタンツに問い合わせてみてほしい(問い合わせ先はこちら)。
無料メルマガ会員に登録しませんか?
技術・科学系ライター。修士(応用化学)。石油メーカー勤務を経て、2017年よりライターとして活動。科学雑誌などにも寄稿している。