「ロボットは東大に入れるか」プロジェクト、AIが模試に挑戦し偏差値を大幅に向上

大学共同利用機関法人 情報・システム研究機構 国立情報学研究所(以下、NII)、株式会社富士通研究所、サイバネットシステム株式会社(以下、サイバネット)は、国立大学法人名古屋大学、国立大学法人東京大学と共同で、NIIの人工知能(AI)プロジェクト「ロボットは東大に入れるか」(東ロボ)において、東京大学第2次学力試験に向けた論述式模試とマークシート式の大学入試センター試験模試に挑戦し、論述式模試の数学(理系)で偏差値76.2、センター試験模試の物理では偏差値59.0と、昨年度を大幅に上回る成績をあげたと発表した。

NII、富士通研究所、名古屋大学を中心に構成する「東ロボ」数学チームは、学校法人高宮学園 代々木ゼミナールの論述式模試「東大入試プレ」(注1)に挑戦した。数学(理系)では、問題文を入力後、問題文の解釈から、自動求解、解答の作成までをAIにより完全に自動で行い、6問中4問を完答した結果、偏差値76.2(得点80点=120点満点)を獲得。昨年度は、学校法人駿河台学園 駿台予備学校の論述式模試を受験し、数学(理系)は偏差値44.3(20点)だった。

数学チームには平成24年度(2012年度)に富士通研究所、平成25年度(2013年度)に名古屋大学が参加し、3団体を中心に共同研究を行っている。解答プロセスの前半にあたる自然言語処理部分を名古屋大学を中心とするグループ、後半の数式処理部分を富士通研究所を中心とするグループが担当したという。

富士通研究所、サイバネット、東京大学を中心に構成する「東ロボ」物理チームは、従来の技術に数学チームで確立した技術を加えて、昨年度に続いて株式会社ベネッセコーポレーションのセンター試験模試「進研模試 総合学力マーク模試」(注2)に挑戦。シミュレーションの設定において一部で人が介入したが、現時点の自然言語処理技術と画像処理技術を用いれば生成可能と想定される内部形式から、AIによる自動求解の結果、偏差値59.0(62点=100点満点)を達成した。昨年度と比較すると、偏差値で12.5ポイント、得点は20点向上している。

物理チームは昨年度までNIIを中心に研究開発を行っていたが、今年度から、富士通研究所、サイバネット、東京大学の3団体を中心にした新体制で共同研究を行っている。

大学入試問題は問題文を解析する自然言語処理をはじめ様々な技術が求められる統合的な課題で、点数と偏差値により成果を定量的に評価することが可能なタスクだ。こうした特性を持つ大学入試問題にAIが挑戦することで、「AIが人間に取って代わる可能性のある分野は何か」といった問題を考える際の指標となりうるAIの進化の客観的なベンチマークを指し示すことが、「東ロボ」プロジェクトの目的だという。

平成23年(2011)年4月にスタートし、平成25年度(2013年度)から毎年大学入試の模試に挑戦。各年度の研究成果を評価・検証しながら技術課題を抽出している。今年度までに大学入試センター試験で高得点をマークすることが目標の一つであった。

数学は、人間にとって理解しやすい自然言語や数式で表現された問題文を、計算プログラムで実行可能な形式に変換して、数式処理のプログラム(ソルバ)で問題を解き、人間にとって理解しやすい自然言語で解答。一方、物理は、現実の問題に近い問題設定になっている。例えば、「問題のテキスト」はロボットにおける「人間からの命令」、「図」は「カメラ映像」、「問題で要求される物理量」は「モーターなどの制御値」といったぐあいに対応。これらの成果は、コンピューターやロボットと人間の協調を必要とするAIの開発につながると考えられる。

それぞれの課題は以下のとおり。

  • 数学
    昨年度までは、限量記号消去(注3)と呼ばれる数式の変形を繰り返す技術を適用したソルバで問題を解いていた。これは多項式の等式・不等式を扱う実数問題に対する汎用的な解法で、広範な単元の問題を解くことができる。しかし、三角関数を含む問題には直接適用できないため、白紙回答になることがあった。
  • 物理
    昨年度まで、AIは問題テキストを言語処理技術により解析して、内部形式に変換し、それを元に物理シミュレーションの初期条件を構築し、シミュレーション結果から回答する、というシステムを目指して研究開発を行ってきた。昨年度までの開発により、シミュレーションの初期条件を人が設定すれば、物理現象を再現することで、一部の入試問題が解けることは確認できていたが、人の解釈が必要なため、内部形式からの自動化は達成できていなかった。

開発された技術は以下のとおり。

  • 数学
    数式処理部分において、これまで解けなかった三角関数の問題のうち入試問題によくあらわれるタイプの問題に対して、限量記号消去を適用できる形に変換して解く技術を開発し、ソルバの対応できる問題を広げた。また、言語処理部分では数式解析部と文間関係解析部の開発、文法と辞書の拡充および、構文解析技術の改良などの言語処理の機能拡張により、自動で解ける問題の範囲を広げた。これらの開発の結果、「東大入試プレ」の理系において、昨年度までは一部人の手を介していたが、今回は人の手を介さず完全に自動で偏差値 76.2(80点)を獲得できた。
  • 物理
    言語処理が生成可能と想定される内部形式からその状況を表す条件式を構築し、それを限量記号消去で解いてシミュレーションの初期条件を生成する技術を開発。また、入試問題用のシミュレーションの部品の追加、入試問題では初期条件が答えそのものになる「つりあいの問題」などシミュレータには扱いづらい問題に対して、画像の情報も利用して解く専用のソルバが開発された。これらの対策により、昨年度より自動化の範囲を広げた課題設定で、偏差値59.0(62点)を獲得し、これまでより大幅な向上を達成した。

今後、「東ロボ」の数学・物理チームでは、構文解析処理や文間関係解析処理といった個々の言語処理ステップのさらなる高精度化や、言語処理と数式処理の中間段階での処理手順の工夫、また、言語処理と数式処理のさらなる融合によって、「考えながら読む」技術の研究開発を進め、より多様な問題に対して正確に解答する技術の開発を目指していくという。

産学連携での研究推進の下、名古屋大学、学校法人東京理科大学、国立大学法人筑波大学、学校法人立教学院立教大学の自然言語処理や数式処理などの異なる専門分野の研究者による共同研究が進められた。「東ロボ」は、このような学際的研究を通して、高度な専門性、横断的な知識や研究推進力などを有するπ型人材・問題解決型高度人材育成にも貢献していくという。

また、富士通研究所は、「東ロボ」を通して、深い言語処理の技術や高度な数理技術の開発を推進し、富士通株式会社のAI技術「Human Centric AI Zinrai(ジンライ)」に活用し、サイバネットは、同プロジェクトを通じて得た技術を、子会社 Maplesoftの製品である Maple / MapleSim の開発へ応用し、数理技術の産業応用に寄与していくという。

注1 「東大入試プレ」:
2016年度第1回東大入試プレ。受験者数1,851人(文系669人、理系1,182人)。うち数学受験者は文系662人、理系1,168人。
注2 「進研模試 総合学力マーク模試」:
2016年度進研模試 総合学力マーク模試・6月。受験者総数26万4,604人。
注3 限量記号消去:
QE(Quantifier Elimination)と呼ばれ、等価な数式に変形しながら解を導く数式処理技術。多項式の等式・不等式を扱う任意の実数問題に対する解法。

【関連リンク】
国立情報学研究所(NII)
富士通研究所(FUJITSU LABORATORIES)
サイバネット(Cybernet)
名古屋大学(Nagoya University)
東京大学(The University of Tokyo)
メイプルソフト(Maplesoft)

Previous

京セラ、IoTネットワーク「SIGFOX」を日本で展開し、LPWAネットワーク事業へ参入

IDC、2020年にかけてIoTとコグニティブが「収集可能なデータの最大化」「有効活用可能なデータの最大化」をけん引と発表

Next