要約
STADEEは、機械生成テキストを識別するための統計に基づく検出手法であり、事前に訓練された言語モデル(PLM)の微調整に大きく依存する現在の手法の限界に対処する。STADEEは主要な統計的テキスト特徴をディープ分類器と統合し、トークン確率や累積確率のような、核サンプリングの処理に重要な側面に焦点を当てています。多様なデータセットとシナリオ(ドメイン内、ドメイン外、野生環境)でテストした結果、STADEEは優れた性能を示し、ドメイン内では87.05%のF1スコアを達成し、特にドメイン外や野生環境では、従来の統計的手法とファインチューニングされたPLMの両方を凌駕し、その有効性と汎用性を強調した。
要約(オリジナル)
We present STADEE, a \textbf{STA}tistics-based \textbf{DEE}p detection method to identify machine-generated text, addressing the limitations of current methods that rely heavily on fine-tuning pre-trained language models (PLMs). STADEE integrates key statistical text features with a deep classifier, focusing on aspects like token probability and cumulative probability, crucial for handling nucleus sampling. Tested across diverse datasets and scenarios (in-domain, out-of-domain, and in-the-wild), STADEE demonstrates superior performance, achieving an 87.05% F1 score in-domain and outperforming both traditional statistical methods and fine-tuned PLMs, especially in out-of-domain and in-the-wild settings, highlighting its effectiveness and generalizability.
arxiv情報
著者 | Zheng Chen,Huming Liu |
発行日 | 2023-12-04 06:45:47+00:00 |
arxivサイト | arxiv_id(pdf) |