Diffusion Models as Artists: Are we Closing the Gap between Humans and Machines?

要約

AI の重要なマイルストーンは、人間の描画と見分けがつかない描画を生成できるアルゴリズムの開発です。
ここでは、Boutin et al, 2022 の「多様性 vs 認識可能性」スコアリング フレームワークを適用し、ワンショット拡散モデルが実際に人間と機械の間のギャップを埋め始めていることを発見しました。
しかし、個々のサンプルのオリジナリティをよりきめ細かく測定して、拡散モデルのガイダンスを強化すると、その描画の人間らしさの向上には役立つものの、人間の描画のオリジナリティや認識可能性を近似するにはまだ達していないことを示します。
オンラインの精神物理学実験を通じて収集された人間のカテゴリーの診断特徴を拡散モデルから得られた特徴と比較すると、人間がより少ない、より局所的な特徴に依存していることが明らかになります。
全体として、私たちの研究は、普及モデルが機械生成図面の品質向上に大きく貢献していることを示唆しています。
しかし、人間と機械の間には依然として溝があり、その一部は視覚的戦略の不一致によって説明できます。

要約(オリジナル)

An important milestone for AI is the development of algorithms that can produce drawings that are indistinguishable from those of humans. Here, we adapt the ‘diversity vs. recognizability’ scoring framework from Boutin et al, 2022 and find that one-shot diffusion models have indeed started to close the gap between humans and machines. However, using a finer-grained measure of the originality of individual samples, we show that strengthening the guidance of diffusion models helps improve the humanness of their drawings, but they still fall short of approximating the originality and recognizability of human drawings. Comparing human category diagnostic features, collected through an online psychophysics experiment, against those derived from diffusion models reveals that humans rely on fewer and more localized features. Overall, our study suggests that diffusion models have significantly helped improve the quality of machine-generated drawings; however, a gap between humans and machines remains — in part explainable by discrepancies in visual strategies.

arxiv情報

著者 Victor Boutin,Thomas Fel,Lakshya Singhal,Rishav Mukherji,Akash Nagaraj,Julien Colin,Thomas Serre
発行日 2023-05-31 16:02:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC パーマリンク