Evaluating a Synthetic Image Dataset Generated with Stable Diffusion

要約

Wordnetタクソノミとそれに含まれる概念の定義を用いて、「Stable Diffusion」画像生成モデルで合成画像を生成する。この合成画像データベースは、機械学習アプリケーションにおけるデータ補強のための学習データとして利用可能であり、Stable Diffusionモデルの能力を調査するために使用される。 解析の結果、Stable Diffusionは多数の概念に対して正しい画像を生成できるだけでなく、多種多様な異なる表現も生成できることがわかった。また、考慮するテスト概念による違いや、非常に特殊な概念での問題があることがわかった。これらの評価は、画像分類のための視覚変換モデルを用いて行われた。

要約(オリジナル)

We generate synthetic images with the ‘Stable Diffusion’ image generation model using the Wordnet taxonomy and the definitions of concepts it contains. This synthetic image database can be used as training data for data augmentation in machine learning applications, and it is used to investigate the capabilities of the Stable Diffusion model. Analyses show that Stable Diffusion can produce correct images for a large number of concepts, but also a large variety of different representations. The results show differences depending on the test concepts considered and problems with very specific concepts. These evaluations were performed using a vision transformer model for image classification.

arxiv情報

著者 Andreas Stöckl
発行日 2022-11-04 09:28:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク