A Survey of AI-generated Text Forensic Systems: Detection, Attribution, and Characterization

要約

最近、高品質のテキストを生成できる高度な大規模言語モデル(LLM)が急速に普及している。これらのLLMは、様々な領域におけるテキスト生成に革命をもたらした一方で、説得力のあるプロパガンダ、誤報、偽情報を大規模に生成する可能性など、情報エコシステムに重大なリスクももたらしている。本稿では、LLMの悪用という課題に対処する新たな分野である、AI生成テキストフォレンジックシステムのレビューを行う。検出、帰属、特徴付けという3つの主要な柱に焦点を当てた詳細な分類法を紹介することで、AI生成テキストフォレンジックにおける既存の取り組みの概要を示す。これらの柱は、AIが生成したコンテンツの特定(検出)、関連する特定のAIモデルの決定(帰属)、テキストの根本的な意図のグループ化(特徴づけ)に至るまで、AIが生成したテキストの実用的な理解を可能にする。さらに、AI生成テキストフォレンジック研究のための利用可能なリソースを探索し、AI時代におけるフォレンジックシステムの進化する課題と将来の方向性について議論する。

要約(オリジナル)

We have witnessed lately a rapid proliferation of advanced Large Language Models (LLMs) capable of generating high-quality text. While these LLMs have revolutionized text generation across various domains, they also pose significant risks to the information ecosystem, such as the potential for generating convincing propaganda, misinformation, and disinformation at scale. This paper offers a review of AI-generated text forensic systems, an emerging field addressing the challenges of LLM misuses. We present an overview of the existing efforts in AI-generated text forensics by introducing a detailed taxonomy, focusing on three primary pillars: detection, attribution, and characterization. These pillars enable a practical understanding of AI-generated text, from identifying AI-generated content (detection), determining the specific AI model involved (attribution), and grouping the underlying intents of the text (characterization). Furthermore, we explore available resources for AI-generated text forensics research and discuss the evolving challenges and future directions of forensic systems in an AI era.

arxiv情報

著者 Tharindu Kumarage,Garima Agrawal,Paras Sheth,Raha Moraffah,Aman Chadha,Joshua Garland,Huan Liu
発行日 2024-03-02 09:39:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク