MasonTigers at SemEval-2024 Task 8: Performance Analysis of Transformer-based Models on Machine-Generated Text Detection

要約

このペーパーでは、SemEval-2024 タスク 8 – マルチジェネレーター、マルチドメイン、および多言語ブラックボックスの機械生成テキスト検出への MasonTigers エントリーを紹介します。
このタスクには、人間が書いたテキストと機械が生成したテキストのバイナリ分類 (トラック A)、多方向の機械生成テキスト分類 (トラック B)、および人間と機械の混合テキスト検出 (トラック C) が含まれます。
私たちの最高のパフォーマンスを発揮するアプローチは、主に弁別器トランスフォーマー モデルのアンサンブルと、特定のケースにおけるセンテンス トランスフォーマーおよび統計的機械学習アプローチを利用します。
さらに、FLAN-T5 のゼロショット プロンプトと微調整がトラック A と B に使用されます。

要約(オリジナル)

This paper presents the MasonTigers entry to the SemEval-2024 Task 8 – Multigenerator, Multidomain, and Multilingual Black-Box Machine-Generated Text Detection. The task encompasses Binary Human-Written vs. Machine-Generated Text Classification (Track A), Multi-Way Machine-Generated Text Classification (Track B), and Human-Machine Mixed Text Detection (Track C). Our best performing approaches utilize mainly the ensemble of discriminator transformer models along with sentence transformer and statistical machine learning approaches in specific cases. Moreover, zero-shot prompting and fine-tuning of FLAN-T5 are used for Track A and B.

arxiv情報

著者 Sadiya Sayara Chowdhury Puspo,Md Nishat Raihan,Dhiman Goswami,Al Nahian Bin Emran,Amrita Ganguly,Ozlem Uzuner
発行日 2024-03-22 06:47:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク