Human Aesthetic Preference-Based Large Text-to-Image Model Personalization: Kandinsky Generation as an Example

要約

ニューラル生成機能の進歩に伴い、アート コミュニティは絵画コンテンツの作成に GenAI (生成人工知能) を積極的に採用しています。
大規模なテキストから画像へのモデルでは、見た目の美しい結果を迅速に生成できます。
ただし、ユーザーは目的の結果を達成するための効果的なプロンプトを作成するのに苦労するため、このプロセスは非決定的になる可能性があり、退屈な試行錯誤を伴うことがよくあります。
このペーパーでは、カスタマイズされた芸術スタイルに美的好みを組み込んだパーソナライズされた絵画コンテンツをユーザーが自動的に生成できるようにする、プロンプト不要の生成アプローチを紹介します。
このアプローチには、「セマンティック インジェクション」を利用してアーティスト モデルを特定の芸術スタイルにカスタマイズすること、さらに遺伝的アルゴリズムを活用して、リアルタイムで反復的な人間によるフィードバックを通じてプロンプト生成プロセスを最適化することが含まれます。
このアプローチは、アーティスト モデルが生成した画像に対するユーザーの美的評価と好みだけに依存することにより、ユーザーの美的好みとカスタマイズされた芸術的スタイルを包含するパーソナライズされたモデルをユーザーに作成します。

要約(オリジナル)

With the advancement of neural generative capabilities, the art community has actively embraced GenAI (generative artificial intelligence) for creating painterly content. Large text-to-image models can quickly generate aesthetically pleasing outcomes. However, the process can be non-deterministic and often involves tedious trial-and-error, as users struggle with formulating effective prompts to achieve their desired results. This paper introduces a prompting-free generative approach that empowers users to automatically generate personalized painterly content that incorporates their aesthetic preferences in a customized artistic style. This approach involves utilizing “semantic injection” to customize an artist model in a specific artistic style, and further leveraging a genetic algorithm to optimize the prompt generation process through real-time iterative human feedback. By solely relying on the user’s aesthetic evaluation and preference for the artist model-generated images, this approach creates the user a personalized model that encompasses their aesthetic preferences and the customized artistic style.

arxiv情報

著者 Aven-Le Zhou,Yu-Ao Wang,Wei Wu,Kang Zhang
発行日 2024-02-09 13:11:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.MM パーマリンク