ディープラーニングを活用したAIの社会実装事業を展開する株式会社ABEJAは、大量のデータから教師データを作成する「アノテーション」機能に、以下3つの機能を追加し、本日提供を開始した。
- 領域抽出(Image Semantic Segmentation/イメージ セマンティック セグメンテーション)
- 動画アノテーション(Scene Recognition/シーン リコグニション)
- テキストアノテーション(Text Classification/テキスト クラシフィケーション)
また、今回の機能追加にあわせ、従来「ABEJA Platform」のユーザーのみに提供をしていた「アノテーションツール」と「データ作成委託サービス」を、単体サービスとしても提供開始した。
ABEJAが提供する「ABEJA Platform」は、AIの継続的なインテグレーションに必要なパイプラインを包括的に提供するプラットフォームであり、AI、特にディープラーニングを活用するための5つの運用サイクル、①取得、②蓄積、③学習、④デプロイ、⑤運用(推論・再学習)、における各工程において必要なインフラや周辺システム等を利用でき、AI、特にディープラーニングの実装および運用において大幅な省力化・自動化を可能とするプラットフォームだ。
アノテーションは、このうち、③学習の工程において、取得した大量のデータを識別および分類し、教師データ(正解データ)を作成する機能。精度の高い学習済みモデルを生成するうえで重要な工程である一方で、コンピューターによる自動化が難しい領域であり、人手による大量なデータの識別および分類が必要であるため、アノテーションを行う多数の人材を確保する必要があるという。
ABEJAでは、同課題を解決すべく、2017年12月に、アノテーションの工程を自動化、省力化する仕組みである、アノテーションをより容易にかつ正しく行うためのツールと、即時に大量なデータのアノテーションを行える人材をABEJAの管理下で提供する委託サービスを、「ABEJA Platform」の機能の1つとして、提供を開始している。
今回、「アノテーションツール」に追加された機能は、これまで提供していた一般的な画像のデータ識別や分類に加え、画像のピクセル単位で領域認識を行う領域抽出、映像データの特定シーンに対してラベル付けを行う動画アノテーション、テキスト情報に対してラベル付けを行うテキストアノテーション、の3つの機能だ。
- 領域抽出機能
同機能を利用し作成した教師付きデータからモデルを学習することにより、自動運転における道路範囲の検出や製造業での異常部分のピクセル単位での検出などが可能となる。従来の領域抽出は、ピクセル単位でのアノテーションが必要だったため多大な労力を要していたが、同機能の利用により、領域の自動検出が可能となり、アノテーションコストを大幅に削減することも可能となった。 - 動画アノテーション
同機能を利用し作成した教師付きデータからモデルを学習することにより、製造業などの工場や店舗で撮影したカメラ映像から連続したシーンの検出、テレビ・映画・オンデマンドストリーミング・SNSへの投稿動画などの放送業界・映像メディアから特定シーンの検出等が可能となる。 - テキストアノテーション
同機能を利用し作成した教師付きデータからモデルを学習することにより、ブログ本文やSNSの投稿などのテキスト情報の分類や不適切なコンテンツの摘出等が可能となる。
<アノテーションツール機能一覧>
- 画像分類 (Image Classification/イメージ クラシフィケーション):2017年12月提供開始
- 物体検出 (Object Detection/オブジェクト ディテクション):2017年12月提供開始
- 領域抽出(Image Semantic Segmentation):2018年9月提供開始
- 動画アノテーション(Scene Recognition):2018年9月提供開始
- テキストアノテーション(Text Classification):2018年9月提供開始
- 音声アノテーション(Voice Translation/ボイス トランスレーション):2018年内提供開始予定
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。