パナソニックR&Dカンパニー オブ アメリカ(以下、PRDCA)とパナソニック ホールディングス株式会社(以下、パナソニックHD)は、UCLAの研究者と共同で、AIが推論時に自らの生成結果を振り返り改善する画像生成技術「Reflect-Dit」を開発した。
同技術は、大規模学習を行わずに生成結果の品質を向上させる新たな手法だ。
従来の画像生成AIでは、品質向上のために大規模なデータセットと長時間の学習が必要であり、開発コストや計算負荷が大きいという課題があった。
また、生成画像の改善には「Best-of-N」と呼ばれる手法が一般的で、大量の画像を生成して最も品質の高いものを選定するという非効率な手順を踏んでいた。
今回開発された「Reflect-Dit」は、この課題を解決するため、推論時に生成画像の改善点をAI自身がテキストでフィードバックするという新たなアプローチを採用している。
画像生成AIの入力部に「フィードバック処理ネットワーク」を追加し、生成画像とテキストプロンプトを視覚言語モデル(VLM)が比較する。

そして、改善点をテキストとして生成し、画像生成AIに入力することで、AIが自らの生成結果を振り返り、それをAIに再入力することで次の生成に活かすという自動改善ループを実現している。(トップ画参照)
評価実験では、既存手法「Best-of-20」と「Reflect-Dit」を比較。その結果、物体の個数(count)、属性(attribution)、位置(position)といった生成精度の指標全てで「Reflect-Dit」が上回る結果となった。
また、同等の品質を得るために必要な生成回数は既存手法の約5分の1で済み、より効率的に画像品質を改善できることが確認された。

今後「Reflect-Dit」は、学習を行わずに生成品質を改善できる点が特徴であり、住宅事業などへの応用が期待されている。
例えば、営業担当者が住宅のレイアウトや照明デザインのカタログを生成する際、手元のPCで簡単に修正・再生成を行うことが可能になり、業務効率化につながるという。
なお、同技術は、AI・Computer Vision分野の国際会議「IEEE/CVF International Conference on Computer Vision(ICCV)2025」に採択され、2025年10月19日から23日にかけて米国ハワイで発表されるとのことだ。
無料メルマガ会員に登録しませんか?

IoTに関する様々な情報を取材し、皆様にお届けいたします。