要約
この作業では、もともと拡散モデルで創造性を近似するために使用されていたスタイルのあいまいさのトレーニング目標を使用して探求します。
ただし、この目的では、前処理された分類器とラベル付きデータセットの使用が必要です。
分類子またはラベル付きデータセットをトレーニングする必要のない新しい形式の曖昧さの損失を導入し、新しい方法が自動化されたメトリックとユーザー研究の両方でより高いスコアを獲得して、斬新さと評価を分析することを示します。
https://github.com/jamesbaker361/clipcreateで利用可能なコード
要約(オリジナル)
In this work, we explore using the style ambiguity training objective, originally used to approximate creativity, on a diffusion model. However, this objective requires the use of a pretrained classifier and a labeled dataset. We introduce new forms of style ambiguity loss that do not require training a classifier or a labeled dataset, and show that our new methods score higher both on automated metrics and user studies to analyze novelty and appreciation. Code available at https://github.com/jamesBaker361/clipcreate
arxiv情報
著者 | James Baker |
発行日 | 2025-02-26 17:07:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google