EduLab、ディープラーニングに基づく人工知能を活用し、日本語の手書き文字認識率98.66%を実現

Edtech事業を展開する株式会社EduLab(以下「EduLabグループ」)は、ディープラーニングに基づく手書き文字(日本語)認識技術の開発プロジェクトを2015年より進め、手書き文字(日本語)認識率において、2016年6月時点で業界トップレベルの認識率98.66%を実現した。

EduLabグループは上記技術を、主に手書き答案採点等のテスト分野に応用していく予定だという。

 

開発の背景

2007年の学校基本法改正は、知識・技能を活用し課題を解決するために必要な思考力・判断力・表現力等の育成をすることを新しい時代の学力像として制定した。

中央教育審議会による答申「新しい時代にふさわしい高大接続の実現に向けた高等学校教育、大学教育、大学入学者選抜の一体的改革について」(2014年12月)では、現在の大学入試センター試験が、「知識・技能」を問う問題が中心になっているとした上で、今後は「知識・技能」と「思考力・判断力・表現力」を総合的に評価するものにしていくことが必要であると書かれており、大学入試においても課題解決力を重視する傾向にある。

このような背景の中、入学試験・国や地方自治体の学力調査・各種検定試験等において記述式の解答方式が加速的に増えている。しかし、記述式の解答方式では、採点者の判断を要するため採点に時間がかかりすぎ、採点費用の増大がテスト実施主体の大きな負担となっている。このことは機械的に採点できる選択式の解答方式と比較すると大きな課題だ。

 

開発プロジェクトの概要

EduLabグループは、これまで100万人規模の学力調査の採点業務を多数受託してきた実績がある。学力調査の採点を実施する中で、記述式解答をより標準化しより効率的な方法で採点を行うことを常に検討してきた。

初期の検討(2006年)は、手書き文字をテキストデータ化した上で採点することだった。この方法を採用することで、採点効率の飛躍的な向上につながると考え検討を始めた。なぜなら、パンチャーという人の手を使ったデータ入力作業は、手書き文字をデータ化するための一つの方法ではあったが、人の手を使う以上大幅な時間の短縮は達成困難だ。

また、スキャナーを使用しながらデータ化を行うためのOCR(Optical character recognition:光学文字認識)技術は、入力枠という制約が生じるだけでなく、手書き文字の場合の認識誤りも一定割合以上発現していまい、試験の採点に耐えうる品質精度を達成することは難しいと判断した。そのため、ディープラーニングに基づく人工知能技術を用いて高精度な手書き文字認識技術を開発することにしたという。

2015年、ディープラーニングに精通した専門会社と共に、EduLabグループが保有する豊富なフィールドデータを活用した日本語の手書き文字認識技術の開発プロジェクトを立ち上げ、記述式解答の採点効率化への試みの第一歩として手書き解答を自動でテキストデータ化する技術の開発に取り組んできた。今回、第1段階の開発において手書き文字(日本語)認識率98.66%の実現により、1設問あたり最大83%の採点工数カット(*同社算出比)を実現した。

 

今後について

EduLabグループは、手書き文字認識技術の精度向上のため、開発プロジェクトを更に進め、テキストデータ化された解答を自動採点する技術や、採点や採点プロセスの効率化・自動化を実現すべくAI(人工知能技術)に基づき今後も開発を推し進める予定だという。

 

【関連リンク】
株式会社EduLab
エデュラボ(EduLab)

Previous

Queen Bee and Dronetoと気象海洋コンサルタント、ドローン向け専用気象情報サービスの提供

DeNA、EasyMileと業務提携し、私有地における無人運転バスの交通システムを導入

Next