ITホールディングスグループのTIS株式会社と、国立大学法人奈良先端科学技術大学院大学(以下:奈良先端大)は、音声や画像、言語などの複数の情報源を用いてロボットと人とのパブリックスペースにおけるスムーズなコミュニケーションの実現を目指す「マルチモーダルインタラクション(※1)を用いた対話処理に関する研究」を、2015年11月から共同で開始したことを発表した。
※1 マルチモーダルインタラクション:視覚・聴覚を含め、複数(マルチ)のコミュニケーションモードを利用し、システムとインタラクション(コミュニケーション)を行うこと
【共同研究概要】
・研究題目:「マルチモーダルインタラクションを用いた対話処理」に関する研究
・研究期間:2015年11月~2016年3月
・研究概要:マルチモーダルインタラクションを用いた高度な対話処理の研究を行う
<研究項目>
1)ユーザー理解:音声、画像、音声認識後のテキストなどを用いてユーザーの反応を理解
2)ドメイン知識:ユーザーに提案を行うのに必要な特定ドメインに関する知識構造を構築
3)対話制御:ユーザー理解、ドメイン知識を基にユーザーにとって最適な提案を実現
4)発話、ジェスチャー制御:ユーザーの感情などを反映した発話、ジェスチャー制御の実現
対話処理に関してトップレベルの研究成果を出している奈良先端大の知能コミュニケーション研究室とTISで共同研究を行うことで、ロボットの対話機能の高速化、高度化を実現し、ロボットと人との高度な対話コミュニケーション処理のビジネス活用を目指していく。
音声や画像、言語などの複数(マルチ)の情報源を用いてシステムとコミュニケーションを行う手法である「マルチモーダルインタラクション」は、今後普及が期待されるロボットとの高度な対話コミュニケーション処理を実現するための重要な技術領域だ。
奈良先端大の情報科学研究科 知能コミュニケーション研究室は、2011年より「対話処理」の研究を行っており、対話に関する国際学会(※2)で発表するなど国内でトップレベルの研究成果を出している。翻訳分野においてもトップレベルの研究成果があり、翻訳に関する国際学会(※3)の発表だけでなく同時通訳に関する研究成果を大手メディアに取りあげられるなど2020年東京オリンピックで必要とされるような主要技術を研究している国内でも有数の研究室だ。
また、同研究室では、情報案内・多人数対話などを行う次世代型対話システムの研究を進めている。今回の共同研究では、こうした対話において実際に求められる対話の機能・課題についてのモデル化・実証が期待される。
※2 対話に関する国際学会:SIGDIAL、ICASSP
※3 翻訳に関する国際学会:ACL
TISでは、「機械学習」「自然言語処理」に関わるAI技術の強化のために「AI技術推進室」を2015年11月に新設し、ビジネス活用に向けた技術研究・検証などを進めており、今回の共同研究もその一環として実施するものだ。
無料メルマガ会員に登録しませんか?
IoTに関する様々な情報を取材し、皆様にお届けいたします。