DWReCO at CheckThat! 2023: Enhancing Subjectivity Detection through Style-based Data Sampling

要約

この文書では、CheckThat! での主観性検出タスクに対する私たちの提出について説明します。
研究室
タスクにおけるクラスの不均衡に対処するために、ジャーナリズムの観点に基づく主観性チェックリストからさまざまなスタイルのプロンプトを使用して、GPT-3 モデルを使用して追加のトレーニング資料を生成しました。
拡張トレーニング セットを使用して、言語固有のトランスフォーマー モデルを微調整しました。
英語、ドイツ語、トルコ語での私たちの実験は、異なる主観的なスタイルがすべての言語で効果的であることを示しています。
さらに、スタイルベースのオーバーサンプリングは、トルコ語や英語での言い換えよりも優れていることがわかります。
最後に、GPT-3 モデルは、英語以外の言語でスタイルベースのテキストを生成するときに、精彩のない結果を生成することがあります。

要約(オリジナル)

This paper describes our submission for the subjectivity detection task at the CheckThat! Lab. To tackle class imbalances in the task, we have generated additional training materials with GPT-3 models using prompts of different styles from a subjectivity checklist based on journalistic perspective. We used the extended training set to fine-tune language-specific transformer models. Our experiments in English, German and Turkish demonstrate that different subjective styles are effective across all languages. In addition, we observe that the style-based oversampling is better than paraphrasing in Turkish and English. Lastly, the GPT-3 models sometimes produce lacklustre results when generating style-based texts in non-English languages.

arxiv情報

著者 Ipek Baris Schlicht,Lynn Khellaf,Defne Altiok
発行日 2023-07-07 12:34:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.LG パーマリンク