NTT、LLMによる視覚読解技術を開発し「tsuzumi」へ導入

NTT、LLMによる視覚読解技術を開発し「tsuzumi」へ導入

文書には、テキストやアイコンや図表などの視覚要素が含まれており、こうした実世界の文書を読解し理解する技術の実現は、AI分野における課題の一つだ。 そこで日本電信電話株式会社(以下、NTT)は、大規模言語モデル(以下、LL … Read more