AI-Generated Images as Data Source: The Dawn of Synthetic Era

要約

ビジュアル インテリジェンスの進歩は、本質的にデータの可用性と結びついています。
同時に、生成型人工知能 (AI) によって、現実世界の写真によく似た合成画像を作成できる可能性が解放され、生成型 AI の進歩から視覚知能がどのような恩恵を受けるのかという、切実な疑問が生じています。
この論文では、これらの AI 生成画像を新しいデータ ソースとして利用し、ビジュアル インテリジェンスにおける従来のモデル パラダイムを再構築するという革新的なコンセプトを探ります。
実際のデータとは対照的に、AI によって生成されたデータ ソースは、比類のない豊富さとスケーラビリティ、膨大なデータセットの迅速な生成、エッジ ケースの簡単なシミュレーションなど、顕著な利点を示します。
生成 AI モデルの成功に基づいて、機械学習モデルのトレーニングから計算モデリング、テスト、検証のためのシナリオのシミュレーションまで、さまざまなアプリケーションにおける生成データの可能性を検証します。
私たちは、生成 AI のこの画期的な使用をサポートする技術的基盤を調査し、この変革的なパラダイム シフトに伴う倫理的、法的、実践的な考慮事項について徹底的な議論を行います。
この論文は、現在のテクノロジーとアプリケーションの徹底的な調査を通じて、視覚知能における合成時代の包括的な見解を示します。
この論文に関連するプロジェクトは https://github.com/mwxely/AIGS にあります。

要約(オリジナル)

The advancement of visual intelligence is intrinsically tethered to the availability of data. In parallel, generative Artificial Intelligence (AI) has unlocked the potential to create synthetic images that closely resemble real-world photographs, which prompts a compelling inquiry: how visual intelligence benefit from the advance of generative AI? This paper explores the innovative concept of harnessing these AI-generated images as a new data source, reshaping traditional model paradigms in visual intelligence. In contrast to real data, AI-generated data sources exhibit remarkable advantages, including unmatched abundance and scalability, the rapid generation of vast datasets, and the effortless simulation of edge cases. Built on the success of generative AI models, we examines the potential of their generated data in a range of applications, from training machine learning models to simulating scenarios for computational modeling, testing, and validation. We probe the technological foundations that support this groundbreaking use of generative AI, engaging in an in-depth discussion on the ethical, legal, and practical considerations that accompany this transformative paradigm shift. Through an exhaustive survey of current technologies and applications, this paper presents a comprehensive view of the synthetic era in visual intelligence. A project associated with this paper can be found at https://github.com/mwxely/AIGS .

arxiv情報

著者 Zuhao Yang,Fangneng Zhan,Kunhao Liu,Muyu Xu,Shijian Lu
発行日 2023-10-09 16:01:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク