要約
AIに生成されたメディアの急増は、情報の信頼性と社会的信頼に大きな課題をもたらし、信頼できる検出方法を非常に要求します。
AIに生成された培地を検出する方法は、マルチモーダル大手言語モデル(MLLM)の進歩と並行して、急速に進化しました。
現在の検出アプローチは、非MLLMベースとMLLMベースのメソッドの2つの主要なグループに分類できます。
前者は、深い学習技術を搭載した高精度のドメイン固有の検出器を採用していますが、後者は、信頼性の検証、説明可能性、ローカリゼーション機能を統合するMLLMSに基づく汎用検出器を利用します。
この分野では大きな進歩にもかかわらず、ドメイン固有から汎用検出方法への移行を調べる包括的な調査に関する文献にはギャップが残っています。
このペーパーでは、両方のアプローチの系統的レビューを提供し、シングルモーダルとマルチモーダルの視点から分析することにより、このギャップに対処します。
これらのカテゴリの詳細な比較分析を提示し、それらの方法論的な類似点と相違点を調べます。
この分析を通じて、潜在的なハイブリッドアプローチを調査し、偽造検出における重要な課題を特定し、将来の研究の方向性を提供します。
さらに、MLLMが検出タスクでますます一般的になるにつれて、倫理的およびセキュリティ上の考慮事項が重要な世界的な懸念として浮上しています。
私たちは、さまざまな管轄区域にわたって生成AI(Genai)を取り巻く規制環境を調べ、この分野の研究者と実践者に貴重な洞察を提供します。
要約(オリジナル)
The proliferation of AI-generated media poses significant challenges to information authenticity and social trust, making reliable detection methods highly demanded. Methods for detecting AI-generated media have evolved rapidly, paralleling the advancement of Multimodal Large Language Models (MLLMs). Current detection approaches can be categorized into two main groups: Non-MLLM-based and MLLM-based methods. The former employs high-precision, domain-specific detectors powered by deep learning techniques, while the latter utilizes general-purpose detectors based on MLLMs that integrate authenticity verification, explainability, and localization capabilities. Despite significant progress in this field, there remains a gap in literature regarding a comprehensive survey that examines the transition from domain-specific to general-purpose detection methods. This paper addresses this gap by providing a systematic review of both approaches, analyzing them from single-modal and multi-modal perspectives. We present a detailed comparative analysis of these categories, examining their methodological similarities and differences. Through this analysis, we explore potential hybrid approaches and identify key challenges in forgery detection, providing direction for future research. Additionally, as MLLMs become increasingly prevalent in detection tasks, ethical and security considerations have emerged as critical global concerns. We examine the regulatory landscape surrounding Generative AI (GenAI) across various jurisdictions, offering valuable insights for researchers and practitioners in this field.
arxiv情報
著者 | Yueying Zou,Peipei Li,Zekun Li,Huaibo Huang,Xing Cui,Xuannan Liu,Chenghanyu Zhang,Ran He |
発行日 | 2025-02-12 14:43:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google