TOP >
ニュース > DNPとNHKテクノロジーズ、映像をAIで解析し感情に合わせたフォントで字幕表示する「感情表現字幕システム」を開発
近年、多くの人にわかりやすく情報を伝える「ユニバーサルメディア」へのニーズが高まっており、テレビも聴覚に障がいのある方や高齢者などに向けて、より多くの番組への字幕付与が求められている。
株式会社NHKテクノロジーズ(以下、NT)では、2018年度に「多様な視聴者が番組やコンテンツを楽しめる」をテーマに聴覚に障がいのある人とディスカッションを行い「これまでの字幕放送はフォントに抑揚が無い」「タイミングがずれることがある」「発話者がわかりにくい」といった課題があがる一方で、映像効果としてテロップに使われるユニークなフォントは印象深くなるという意見があがった。
また、制作側では番組に字幕を入れる作業が大きな負荷になっており、自動的に精度の高い字幕を付与できる技術が求められていた。
大日本印刷株式会社(以下、DNP)とNTは、映像と音声をAIで解析し、内容や感情に合わせたイメージのフォントで字幕を表示する「感情表現字幕システム」のプロトタイプを開発した。
同システムは、DNPが開発した文章の内容に合うフォントを自動判別して表示する「DNP感情表現フォントシステム」を活用して、録画や生放送の音声を解析してリアルタイムで字幕を自動付与する。その際、字幕の内容や発話者の表情を解析して感情を把握し、その感情の表現に合うフォントを12種類の中から自動で選んで字幕に使用する。例えば、楽しい内容は丸みのあるフォントで、怒っている内容は角ばったフォントで表示することで、より直感的に内容を伝える。
左:音声解析して言葉に適したフォントで字幕を自動生成
右:一般的な字幕
顔の表情を解析して感情に適したフォントを自動表示(左:「不安」の感情、右:「楽しい」の感情)
12種類の感情・イメージと使用フォントの組み合わせ例(感情の分類やフォントは手動で変更可能)
また、映像内の発話者を特定して自動的にその口元の近くに字幕を表示することができる。これにより、複数の人物が登場する映像でも、誰が何を話しているかを直感的に伝えることができる。
今後両社は、同システムの開発を継続し、字幕放送(オープンキャプション)での実用化を目指す。また、音声認識や感情認識のAIの精度を向上させるほか、リアルタイム性の向上も進め、生放送やインターネット同時配信サービスの字幕(クローズドキャプション)への展開も目指す。さらにDNPは、デジタルサイネージ等の動画の字幕に応用するほか、誰でも利用できる映像編集用ソフトウェアとして提供する計画とした。
無料メルマガ会員に登録しませんか?
膨大な記事を効率よくチェック!
IoTNEWSは、毎日新着ニュースを公開しております。
週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。
- AIに関する最新ニュース
- 実践を重要視する方に聞く、インタビュー記事
- 業務改革に必要なAI活用方などのノウハウ
など、多岐にわたるテーマが配信されております。
また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。
無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。
ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。
無料メルマガ会員登録
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
AIによって「優秀な人材」の定義が変化したことを、どうみるべきか —AI時代の人材採...
まだ、生成AIのチャットボットで消耗しているの? ー自律的に動くAIエージェントが働...
AI時代の「中間管理職クライシス」 —部下がAIに相談する時代、上司の価値はどこに残...
AIに仕事を頼む技術 —なぜ「営業資料を作って」と頼むと失敗するのか?
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
「この施策、成果につながるの?」と聞かれた時の救世主。AIで「施策の根拠」をリアルタ...
予算会議にAIを持ち込んだらどうなるか?Claudeのカスタムビジュアル機能を検証
営業における見込み客の発掘をAIに任せる、Claude Coworkで自動化と生産性...
AIでパワポ生成はどこまでできるか?Claude Cowork×PowerPoint...
Claude Coworkは経費精算をどこまで効率化できる?30件の非構造化データを...
なぜAIは的外れな回答をするのか?RAG構築の要「チャンク分割」と「メタデータ」の概...
「自律型AI」が変えるSEO対策、Claude Codeを用いたSearch Con...
ロー・ノーコードツールDifyとn8n、あなたの業務に最適なのはどっち?両者の思想・...
AIでスカウト文を自動生成!プロフィールから「コピペ感ゼロ」の刺さる文案を自動生成す...
「CV増が売上に繋がらない」を解消!n8nでリードスコアリングと戦略立案を自動化する...