マイクロソフト、視覚障碍者向けアプリ「Seeing AI」日本語版を提供開始

2019年12月3日、日本マイクロソフトはアクセシビリティに関する記者発表会を開き、視覚障碍者向けトーキングカメラアプリ「Seeing AI」日本語版の提供開始などを発表した。

アクセシビリティとは何か

12月3日は国連が定めた「国際障害者デー」である。これに合わせて、今回の記者会見はこれまでマイクロソフトが取り組んできたアクセシビリティ、つまり障碍者をテクノロジーで支援する取り組みについてフォーカスを当てた内容になっている。

そもそもアクセシビリティとは何か。マイクロソフト 技術統括室 プリンシパルアドバイザー 大島友子氏(トップ画像右)によれば「障害のある人でも情報やデバイスなどにアクセスできる」という意味で用いているという。

マイクロソフトはこのアクセシビリティについて三十年以上前から取り組んでいるそうだ。ウィンドウズの初期バージョンの頃に障碍者から「ウィンドウズが使えない」という意見があり、それを受けてマイクロソフトではアクセシビリティの研究機関と研究を重ね、ウィンドウズの標準機能としてアクセシビリティ機能を入れたのだという。

ちなみにここでいうアクセシビリティ機能とは、読み上げる機能や、キーボードだけでも操作できる機能などを指す。

ここで大島氏は「地球上のすべての個人とすべての組織がより多くのことを達成できるようにする」というマイクロソフトのミッションを紹介する。上記で記したようなアクセシビリティの活動こそが、まさにこのミッションを具現化したものだといえる。

マイクロソフトはアクセシビリティに関して、以下の四つのレイヤーで取り組んでいるという。

  • People:多様な人材の活躍を後押しするInclusive Hiringの実勢
  • System:アクセシビリティを社会に根付かせるための啓発活動、サポート体制の構築
  • Product:障碍者を含めたすべての人々のためのインクルーシブな製品の開発
  • Future:すべての人々の可能性を最大化する革新的な研究プロジェクト

そして今回、Productの1つである視覚障碍者向けトーキングカメラアプリ「Seeing AI」が、日本語を含む5ヶ国語に対応し提供開始することが発表された。

日本語に対応した「Seeing AI」提供開始

「Seeing AI」は視覚障碍者に向けてAIによる音声読み上げ機能などを提供するアプリで、2017年に英語版がリリースされ現在70ヶ国で提供、ユーザーに使用されたタスクの数は2,000万以上になるという。

今回の会見では、この「Seeing AI」に日本語・オランダ語・フランス語・ドイツ語・スペイン語の5ヶ国語が対応言語として追加されることが発表された。アプリはApp Storeからダウンロードすることができる。

この「Seeing AI」はマイクロソフトのAIである「Cognitive Service」と接続しているという。会見では「Cognitive Service」について詳細な説明があった。

AIというと通常は沢山のデータを集め、そのデータが使えるものかどうかクレンジングをし、コンピュータに学習させ、そこから予測した答えを出す。

しかしマイクロソフトの「Cognitive Service」の場合、学習まで済んだAIを提供している。「Cognitive Service」はビジョンやスピーチなどのカテゴリが分かれているが、その中で「Seeing AI」はビジョンの機能を使っているという。つまり「Seeing AI」はインターネット経由で「Cognitive Service」につながり、そこで学習した結果がアプリにフィードバックされるという仕組みになっているのだ。

「Seeing AI」は以下の8つの機能を備えている。

  • 短いテキスト:テキストにカメラをかざすとすぐに読み上げる機能
  • ドキュメント:「短いテキスト」より長文の文字を認識し読み上げる機能
  • 通貨:紙幣・コインを認識して金額を読み上げる機能
  • 風景:カメラで撮影した風景について、AIがどういう場面か推測し読み上げる機能
  • 製品:バーコードを読み取り、製品情報を読み上げる機能
  • 写真の参照(人):以前撮影した写真を認識する仕組みを用いて、登録した人物を読み上げる機能。年齢や表情を推定することもできる
  • 色:色彩を認識し読み上げる機能
  • ライト:明るさによって異なるトーンの音を出す機能

このうち、会場で「風景」と「製品」の機能を試すことが出来た。

「風景」については会場に東京スカイツリーの写真が用意されており、カメラでそれを撮影すると、「おそらく東京スカイツリーのスクリーンショット」という言葉が読み上げられた。

「製品」の機能では菓子製品のパッケージにカメラをかざし、バーコードを読み込むと英語で製品名が読み上げられた。アプリの利用者は視覚障碍者なので、パッケージを回しながらバーコードの位置を探ることになる。この機能は現在英語のみの対応で、一部の日本製品には適応されないという。

次ページは、「独りで出来ることが増える「Seeing AI」

Previous

「機械の知能化」が飲料製造業を革新する ―オムロン山本氏講演 ドリンクジャパンレポート2

ルネサス、IoTエンドポイント機器を試作できる低消費電力なRL78マイコン搭載のプロトタイピング用ボードを発売

Next