視覚言語事前学習(Vision-Language Pre-training; VLP)技術の多くは、英語中心の開発にされている。
そこで株式会社博報堂テクノロジーズは、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデルを開発し、Hugging Face上で非商用向けに無償公開したことを発表した。
今回開発された視覚言語事前学習モデルは、画像エンコーダの改良と訓練データ量の増加、言語エンコーダの能力強化を行うことで、日本語特化のVLPモデルを実現した。
これにより、画像検索、テキストからの画像生成、画像のタグ付け、画像に対する質問応答などの応用が可能だ。
例えば、「桜の花が満開の公園」など、具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すことが可能となった。
今後博報堂テクノロジーズは、今回のモデル公開を通じて、研究コミュニティやAI技術の開発者に対し、より高度な日本語の視覚言語理解の基盤を提供するとしている。
なお、開発されたVLPモデルの技術的詳細や応用例については、博報堂テクノロジーズの公式Hugging Faceページを通じて提供するとのことだ。
無料メルマガ会員に登録しませんか?
膨大な記事を効率よくチェック!
IoTNEWSは、毎日新着ニュースを公開しております。
週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。
- AIに関する最新ニュース
- 実践を重要視する方に聞く、インタビュー記事
- 業務改革に必要なAI活用方などのノウハウ
など、多岐にわたるテーマが配信されております。
また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。
無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。
ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。
無料メルマガ会員登録
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
AI時代の「中間管理職クライシス」 —部下がAIに相談する時代、上司の価値はどこに残...
AIに仕事を頼む技術 —なぜ「営業資料を作って」と頼むと失敗するのか?
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
Dify×GASで契約書レビューからデータ蓄積・管理までを行う生成AIシステムの構築...
顧客の声を生成AIで活用できる資産へ、ボタンひとつで分析するシステムの構築方法を解説
SNS運用をAIで内製化するには?カスタムAIとノーコードツールで効率化する方法を解...
飲食店運営にAIをどう活用する?「在庫・ロス管理」「売上機会の損失」に対するAIシス...
生成AIでデキる営業の商談メモを再現性のあるナレッジへ、Difyを使ったナレッジ検索...
AI-OCRとは?基本定義や種類からDifyとGeminiで営業の紙処理を自動化する...
AIで社内に点在するデータを「価値」に変えるには?営業業務効率化へ向けたDifyによ...
カスタマーサポートの仕分けにAIを活用するメリットとは?Difyを活用したシステム構...
営業日報のチェックを生成AIで効率化するには?Difyを活用したワークフロー自動化の...
生成AIでプレゼン資料はどこまで作れるか? 「考える・作る・直す」に活用する具体的ス...