Deep dive into language traits of AI-generated Abstracts

要約

ChatGPT などの生成言語モデルは、学術研究を含むさまざまな分野で人間のような文章を生成できる機能として注目を集めています。
生成されたテキストの急速な急増により、情報の透明性と信頼性を維持するために自動識別の必要性が高まっています。
ただし、これらの生成されたテキストは人間の文章に非常に似ており、文法構造、トーン、パターンに微妙な違いがあることが多く、体系的な精査が困難になります。
この研究では、ChatGPT によって生成された、長さがはるかに短く、制限されている Abstract の検出を試みます。
私たちはテキストの意味論的および語彙的特性を抽出し、従来の機械学習モデルがこれらの要約を確実に検出できることを観察しました。

要約(オリジナル)

Generative language models, such as ChatGPT, have garnered attention for their ability to generate human-like writing in various fields, including academic research. The rapid proliferation of generated texts has bolstered the need for automatic identification to uphold transparency and trust in the information. However, these generated texts closely resemble human writing and often have subtle differences in the grammatical structure, tones, and patterns, which makes systematic scrutinization challenging. In this work, we attempt to detect the Abstracts generated by ChatGPT, which are much shorter in length and bounded. We extract the texts semantic and lexical properties and observe that traditional machine learning models can confidently detect these Abstracts.

arxiv情報

著者 Vikas Kumar,Amisha Bharti,Devanshu Verma,Vasudha Bhatnagar
発行日 2023-12-17 06:03:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク