AIpom at SemEval-2024 Task 8: Detecting AI-produced Outputs in M4

要約

この論文では、人間が書いたテキストと機械が生成したテキストの間の境界を検出するように設計されたシステムである AIpom について説明します (SemEval-2024 タスク 8、サブタスク C: 人間と機械の混合テキスト検出)。
私たちは、命令調整されたデコーダー専用モデルとエンコーダー専用のシーケンス タガーからの予測を組み合わせた 2 段階のパイプラインを提案します。
AIpom は、平均絶対誤差 15.94 を達成し、リーダーボードで 2 位にランクされています。
アブレーション研究では、特にパフォーマンスの向上という点で、エンコーダーおよびデコーダー モデルのパイプライン化の利点が確認されています。

要約(オリジナル)

This paper describes AIpom, a system designed to detect a boundary between human-written and machine-generated text (SemEval-2024 Task 8, Subtask C: Human-Machine Mixed Text Detection). We propose a two-stage pipeline combining predictions from an instruction-tuned decoder-only model and encoder-only sequence taggers. AIpom is ranked second on the leaderboard while achieving a Mean Absolute Error of 15.94. Ablation studies confirm the benefits of pipelining encoder and decoder models, particularly in terms of improved performance.

arxiv情報

著者 Alexander Shirnin,Nikita Andreev,Vladislav Mikhailov,Ekaterina Artemova
発行日 2024-03-28 12:10:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク