ヤマハ株式会社は、音声対話システムにおいて人間らしい自然な対話を可能にする自然応答技術『HEARTalk(ハートーク)※』を開発した。同技術の一部を利用できるソフトウェアとハードウェアのライセンス提供も開始した。
機械やロボットに使われている音声対話システムは日々進化を続けており、さまざまな研究が世界中で数多くなされている。しかし、音声対話システムを搭載した機械やロボットと対話する際に、誰しもがその声を聞いただけですぐに機械の声とわかる不自然さを感じることが多いのも事実だ。
通常、人間同士の会話では、呼びかける方の発話の声の強弱、長短、高低、間、抑揚などからなる「韻律」に合わせて、応答者も同じように発話の「韻律」を細かく変化させることで自然で心の通う会話を成立させている。一方、機械音声による対話システムでは、人間の発話の「韻律」に合わせることなく、応答を行なうため、どうしても不自然さが生じてしまう。相手が嬉しそうに話しているのに暗い印象を与える低く抑揚のない声で返答したり、また、相手が悲しそうに話しているのに高く強い声で返答したりすると自然な会話は成立しない。
同社は、こうした点に着目し、音に携わるメーカーとして永年培ってきた高度な音声処理技術を用いてこの不自然さの問題点を解消する『HEARTalk』を開発した。『HEARTalk』は、人間の呼びかけの「韻律」をリアルタイムに解析し、応答に適した自然な「韻律」を導出することができる、特許出願中の新技術だ。主に既製の音声対話システムでの組み込み用途が想定されており、応答用の機械音声に自然な「韻律」を容易に付加することが可能となる。
いわば『HEARTalk』は、機械やロボットの応答音声に「心」が感じられるようになる、そんな可能性を秘めた技術である。
※『HEARTalk』とは、“HEART+Talk”および“HEAR+Talk”のダブルミーニングからなる造語で、機械と心通った対話を目指すという想いが込められている。
『HEARTalk』を利用した技術の提供について
『HEARTalk』の技術の一部を利用したソフトウェアとハードウェアのライセンス提供が開始された。
提供技術は、『HEARTalk』を「相槌」に特化させたもので、人間の問いかけ音声の入力に合わせて、自然な「韻律」で“うん”、“はい”といった相槌音声を返す。いずれも、人間の発話「内容」の解析は行わず「韻律」の解析処理のみで動作するため、少ない処理量で軽快に動作する。
ソフトウェアライセンスは、主に音声対話システムを既に自社開発されている法人向け。ハードウェアライセンスは、主に玩具向けを想定しており、実装面積の小さい低コストな基板モジュール(下図)、参考回路図、参考サンプルプログラムの3つが提供される。
『HEARTalk』の今後の展開について
同社は、音声認識と音声合成からなる音声対話システムと『HEARTalk』が連動することでより高度な音声対話システムを構築できるものと考えている。
こうした連動を実現するために、同社は『HEARTalk』の最初の協業事例として、株式会社フュートレックとNTTアイティ株式会社との共同研究に既に着手している。それぞれの強みを活かした協業により、『HEARTalk』を用いた新音声対話システムの年内の商品化を目指すという。
【関連リンク】
・ヤマハ(YAMAHA)
・フュートレック(FueTrek)
・NTTアイティ(NTT IT)
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。