DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation

要約

パーソナライズされた画像生成は、パーソナライズされたコンテンツを創造的に生成する優れた機能により、人間の日常の仕事や生活を支援する上で大きな期待を集めています。
しかし、現在の評価は自動化されているものの人間との整合性が取れていないか、時間とコストがかかる人間による評価が必要です。
この研究では、高度なマルチモーダル GPT モデルによって自動化された、人間に合わせたベンチマークである DreamBench++ を紹介します。
具体的には、GPT が人間との調整と自己調整の両方を行えるようにプロンプ​​トを体系的に設計し、タスクの強化を強化します。
さらに、さまざまな画像とプロンプトを含む包括的なデータセットを構築します。
7 つの最新の生成モデルのベンチマークを行うことで、DreamBench++ が人間との整合性を大幅に高めた評価をもたらし、革新的な発見でコミュニティを活性化するのに役立つことを実証しました。

要約(オリジナル)

Personalized image generation holds great promise in assisting humans in everyday work and life due to its impressive function in creatively generating personalized content. However, current evaluations either are automated but misalign with humans or require human evaluations that are time-consuming and expensive. In this work, we present DreamBench++, a human-aligned benchmark automated by advanced multimodal GPT models. Specifically, we systematically design the prompts to let GPT be both human-aligned and self-aligned, empowered with task reinforcement. Further, we construct a comprehensive dataset comprising diverse images and prompts. By benchmarking 7 modern generative models, we demonstrate that DreamBench++ results in significantly more human-aligned evaluation, helping boost the community with innovative findings.

arxiv情報

著者 Yuang Peng,Yuxin Cui,Haomiao Tang,Zekun Qi,Runpei Dong,Jing Bai,Chunrui Han,Zheng Ge,Xiangyu Zhang,Shu-Tao Xia
発行日 2024-06-24 17:58:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク