博報堂テクノロジーズ、日本語特化の視覚言語事前学習モデルを開発

視覚言語事前学習(Vision-Language Pre-training; VLP)技術の多くは、英語中心の開発にされている。

そこで株式会社博報堂テクノロジーズは、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデルを開発し、Hugging Face上で非商用向けに無償公開したことを発表した。

今回開発された視覚言語事前学習モデルは、画像エンコーダの改良と訓練データ量の増加、言語エンコーダの能力強化を行うことで、日本語特化のVLPモデルを実現した。

これにより、画像検索、テキストからの画像生成、画像のタグ付け、画像に対する質問応答などの応用が可能だ。

例えば、「桜の花が満開の公園」など、具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すことが可能となった。

今後博報堂テクノロジーズは、今回のモデル公開を通じて、研究コミュニティやAI技術の開発者に対し、より高度な日本語の視覚言語理解の基盤を提供するとしている。

なお、開発されたVLPモデルの技術的詳細や応用例については、博報堂テクノロジーズの公式Hugging Faceページを通じて提供するとのことだ。

無料メルマガ会員に登録しませんか?

膨大な記事を効率よくチェック!

IoTNEWSは、毎日10-20本の新着ニュースを公開しております。 また、デジタル社会に必要な視点を養う、DIGITIDEという特集コンテンツも毎日投稿しております。

そこで、週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。

  • DXに関する最新ニュース
  • 曜日代わりのデジタル社会の潮流を知る『DIGITIDE』
  • 実践を重要視する方に聞く、インタビュー記事
  • 業務改革に必要なDX手法などDXノウハウ

など、多岐にわたるテーマが配信されております。

また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。

無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。 ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。

無料メルマガ会員登録