株式会社ユニメディアは、本日9月20日より、Deep Learningモデル構築を実現する学習データ作成用アノテーションサービス「ANNOTEQ(アノテック)」の提供を開始した。
ANNOTEQは、「アウトソーシング事業者としての品質管理ノウハウ」「AIサービス提供事業者としてのAI構築ノウハウ」そして「実働100万人以上を誇るクラウドソーシングプラットフォーム」を強みに、専任作業者及びクラウドワーカーを活用して提供するアノテーションサービス。
AIサービスを構築するためのDeep Learningモデルを高精度で構築するためには、アノテーション済みの学習データセットが大量に必要となる。特に、Deep Learningモデルは個社固有であり、無料提供されているアノテーション済み学習データセット等は限定的且つ汎用的なものが多く、各企業のニーズを完全に満たしている状態ではない。また、モデル構築のためには、量だけではなく、より精度の高いデータセットが必要になるため、ただ集めれば良いというわけでもない。
そのような背景の中で、大量の学習データセットを自社で構築することは、人的リソースの確保等、現実的な難易度が高く、高精度且つ安価で、大規模な学習データセットを構築する必要性は、ますます高まっている。
そこで同社は、これまでに培った品質管理ノウハウ、AI構築ノウハウだけでなく、大量のデータセット構築が可能なスケーラブルなリソースであるクラウドソーシングと専任作業者をハイブリッドで活用し、「大規模」「高品質(精度)」「高スピード」、そして「広範囲」の対応が可能なアノテーションサービスANOTEQを構築した。
ANNOTEQの特長は以下の通り。
- 「大規模」
実働100万人以上を誇るクラウドワーカーを最大活用することで、大量作業の実施を、高速で行うことが可能。このスケーラブルなクラウドワーカーリソースを活用することで、1週間10万件以上もの作業対応を可能としている。 - 「高品質(精度)」
BPO事業者として高品質なサービスを提供するために構築を行った、データエントリー業務にて必要となるコンペア機能による高精度データの抽出機能や、作業者の作業内容や承認率によるクラウドワーカーの自動管理機能等のシステムを保有しているだけでなく、NDA契約締結済みのクラウドワーカーも多数保有しており、ただクラウドワーカーを活用するだけでなく、適切に管理し、精度高く作業を実施することが可能。
また、作業に応じて専任作業者とクラウドワーカーの適切な工程分解を実施し、専任作業者が高難易度な作業や作業の品質管理工程を受け持つなど、より高精度な作業を実施することも可能になっている。 - 「高スピード」
クラウドワーカーおよび専任ワーカーを適切に管理し、顧客にあった工程設計を行うことにより、短納期での作業を可能とする。顧客が必要とする適切なタイミングで複数回の分納を行うなど、要望に応じた納品スピードでの対応を実現。 - 「広範囲」
高スピード、高精度で作業を実現するためには、元となる学習前のデータセットが必要となる。ANNOTEQでは、学習前のデータセットに対してアノテーション作業を行うだけでなく、学習前のデータセットそのものを構築することも可能。
同社のリソースをフルで活用することにより、WEB情報の収集だけでなく、リアルの世界に存在しているデータの収集も可能。
サービス提供領域は以下の通り。
- 学習データの収集
・画像/動画データ収集
・手書き文字データ収集(実際の手書き文字記入のスキャンデータ) - 学習データのアノテーション
・画像/動画分類
・自然言語分類
・画像/動画適正判定
・動画音声文字起こし
・音声適正判定
・物体検出 ※2018年内提供開始予定
・物体領域抽出 ※2019年春提供開始予定
今後はサービス提供領域を拡大するだけでなく、より多くの企業がDeep Learningモデル構築をより手軽に行い、多くのAIサービスが世の中に生まれるよう、システム開発企業に向け、アノテーション作業を実施可能なリソースを自由に活用することが可能なAPIの提供を行う。また、APIを活用することが難しい非システム開発企業でも、いつでもアノテーション作業が依頼可能なインターフェースを持つWEBツールの提供を予定しているという。
【関連リンク】
・ユニメディア(UNIMEDIA)
・ANNOTEQ
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。