TOP >
人工知能(AI) > NTTテクノクロスの音声合成ソリューションに、話者の声質を損なわない多言語の合成音声技術を搭載
人の音声を機械的に生成する音声合成技術は、コールセンタをはじめ、公共交通機関やスマートスピーカなどに活用されている。
それらを背景に、合成音声の多言語展開のニーズが高まっているが、多言語の合成音声を生成するには、言語ごとの音声収録だけでなく、その前提として多言語を話せる話者を選出する必要があるなどの課題があり、実際の展開は難しいものであった。
そうした中、NTTテクノクロス株式会社は、いろいろな声を創ることができる音声合成ソリューション「FutureVoice Crayon」に、話者の声質を損なわずに多言語の合成音声を実現するクロスリンガル音声合成技術を搭載し、2023年1月20日から商用提供することを発表した。
今回発表されたクロスリンガル音声合成技術は、音声データと、機械学習の一種であるDNN(Deep Neural Network)音声合成のノウハウを活用し、一言語の音声から日本語、英語、標準中国語、韓国語の合成音声の生成を実現している。(2023年1月時点)
また、声の特徴を示す情報の抽出精度を向上させ、話者の声質の再現性を向上させている。
これにより、翻訳技術との連携によるプレゼンターの声での同時通訳のプレゼンテーションや、自身の声の合成音声による多言語での音声コミュニケーション、好きな声優の多言語の合成音声による外国語学習などの利用シーンが想定されている。
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
AIによって「優秀な人材」の定義が変化したことを、どうみるべきか —AI時代の人材採...
まだ、生成AIのチャットボットで消耗しているの? ー自律的に動くAIエージェントが働...
AI時代の「中間管理職クライシス」 —部下がAIに相談する時代、上司の価値はどこに残...
AIに仕事を頼む技術 —なぜ「営業資料を作って」と頼むと失敗するのか?
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
AIはSaaSを殺さない、「共存戦争」の裏で本当に起きていること
AIが買い物を代行する「エージェント・コマース」時代、Googleが提唱するUniv...
AIエージェントはどこまで使えるか?検証して見えた「二度手間」の課題と正しい距離感
AIエージェント時代到来、OpenAIのワークスペースエージェントを徹底解説、仕組み...
AI活用で営業・マーケティングはここまで変わる、Anthropic公式ユースケースか...
「この施策、成果につながるの?」と聞かれた時の救世主。AIで「施策の根拠」をリアルタ...
予算会議にAIを持ち込んだらどうなるか?Claudeのカスタムビジュアル機能を検証
営業における見込み客の発掘をAIに任せる、Claude Coworkで自動化と生産性...
AIでパワポ生成はどこまでできるか?Claude Cowork×PowerPoint...
Claude Coworkは経費精算をどこまで効率化できる?30件の非構造化データを...