SemEval-2024 Task 8: Weighted Layer Averaging RoBERTa for Black-Box Machine-Generated Text Detection

要約

この文書には、SemEval 2024 のタスク 8: マルチジェネレーター、マルチドメイン、および多言語ブラックボックスの機械生成テキスト検出サブタスク A (単言語) および B の議事録に対する著者の提出の詳細が含まれています。機械生成テキストの検出は、サブタスクになりつつあります。
大規模言語モデル (LLM) の出現により、このタスクはますます重要になっています。
この論文では、RoBERTa レイヤーの加重平均を使用して、機械生成のテキスト検出に関連するテキストに関する情報をどのように取得できるかについて説明します。

要約(オリジナル)

This document contains the details of the authors’ submission to the proceedings of SemEval 2024’s Task 8: Multigenerator, Multidomain, and Multilingual Black-Box Machine-Generated Text Detection Subtask A (monolingual) and B. Detection of machine-generated text is becoming an increasingly important task, with the advent of large language models (LLMs). In this paper, we lay out how using weighted averages of RoBERTa layers lets us capture information about text that is relevant to machine-generated text detection.

arxiv情報

著者 Ayan Datta,Aryan Chandramania,Radhika Mamidi
発行日 2024-04-09 10:19:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク