視覚言語事前学習(Vision-Language Pre-training; VLP)技術の多くは、英語中心の開発にされている。
そこで株式会社博報堂テクノロジーズは、日本語に特化した画像とテキストの理解を深めるための視覚言語事前学習モデルを開発し、Hugging Face上で非商用向けに無償公開したことを発表した。
今回開発された視覚言語事前学習モデルは、画像エンコーダの改良と訓練データ量の増加、言語エンコーダの能力強化を行うことで、日本語特化のVLPモデルを実現した。
これにより、画像検索、テキストからの画像生成、画像のタグ付け、画像に対する質問応答などの応用が可能だ。
例えば、「桜の花が満開の公園」など、具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すことが可能となった。
今後博報堂テクノロジーズは、今回のモデル公開を通じて、研究コミュニティやAI技術の開発者に対し、より高度な日本語の視覚言語理解の基盤を提供するとしている。
なお、開発されたVLPモデルの技術的詳細や応用例については、博報堂テクノロジーズの公式Hugging Faceページを通じて提供するとのことだ。
無料メルマガ会員に登録しませんか?
膨大な記事を効率よくチェック!
IoTNEWSは、毎日新着ニュースを公開しております。
週一回配信される、無料のメールマガジン会員になっていただくと、記事一覧やオリジナルコンテンツの情報が取得可能となります。
- AIに関する最新ニュース
- 実践を重要視する方に聞く、インタビュー記事
- 業務改革に必要なAI活用方などのノウハウ
など、多岐にわたるテーマが配信されております。
また、無料メルマガ会員になると、会員限定のコンテンツも読むことができます。
無料メールから、気になるテーマの記事だけをピックアップして読んでいただけます。
ぜひ、無料のメールマガジンを購読して、貴社の取り組みに役立ててください。
無料メルマガ会員登録
IoTに関する様々な情報を取材し、皆様にお届けいたします。
企業向けAI活用虎の巻
AIによって「優秀な人材」の定義が変化したことを、どうみるべきか —AI時代の人材採...
まだ、生成AIのチャットボットで消耗しているの? ー自律的に動くAIエージェントが働...
AI時代の「中間管理職クライシス」 —部下がAIに相談する時代、上司の価値はどこに残...
AIに仕事を頼む技術 —なぜ「営業資料を作って」と頼むと失敗するのか?
生成AIは、使い手の「言語化能力」を暴く、リトマス試験紙
AIに「ゴミ」を食わせるな ーAIエージェントが賢くなるデータ、バカになるデータ
AIで業務を自動化する方法とは ーなぜ、ChatGPTを配っても仕事は減らないのか?
なぜあなたの会社で、生成AIが活用されないのか?どこで活用すべきか?
生成AI活用ガイド
なぜAIは的外れな回答をするのか?RAG構築の要「チャンク分割」と「メタデータ」の概...
「自律型AI」が変えるSEO対策、Claude Codeを用いたSearch Con...
ロー・ノーコードツールDifyとn8n、あなたの業務に最適なのはどっち?両者の思想・...
AIでスカウト文を自動生成!プロフィールから「コピペ感ゼロ」の刺さる文案を自動生成す...
「CV増が売上に繋がらない」を解消!n8nでリードスコアリングと戦略立案を自動化する...
ノーコードで実現!人事データの不整合を自動抽出する給与監査システムの構築方法を解説
AIはどんな業務を効率化できる?13の検証事例から見えた生成AI導入方法と活用を徹底...
現代のOJTの新常識!?Difyで教育を「補完」する対話型AIメンターの構築方法を解...
Dify×GASで契約書レビューからデータ蓄積・管理までを行う生成AIシステムの構築...
顧客の声を生成AIで活用できる資産へ、ボタンひとつで分析するシステムの構築方法を解説