SaRoHead: A Dataset for Satire Detection in Romanian Multi-Domain News Headlines

要約

見出しはニュース記事の重要な部分であり、表現力と暴露された主題へのつながりの影響を受けます。
ほとんどのニュースアウトレットは、現実を客観的に提示することを目指していますが、一部の出版物は、風刺、皮肉、皮肉のスタイルの要素が特定のトピックをカバーするためにブレンドするユーモラスなアプローチを好みます。
見出しがニュース記事の背後にある主なアイデアを公開することを目的としているため、風刺検出は難しい場合があります。
この論文では、ルーマニアのマルチドメインニュースヘッドラインでの風刺検出の最初のコーパスであるサロヘッドを提案します。
私たちの調査結果は、いくつかの非飽和の見出しで使用されているクリックベイトがモデルに大きく影響することを示しています。

要約(オリジナル)

The headline is an important part of a news article, influenced by expressiveness and connection to the exposed subject. Although most news outlets aim to present reality objectively, some publications prefer a humorous approach in which stylistic elements of satire, irony, and sarcasm blend to cover specific topics. Satire detection can be difficult because a headline aims to expose the main idea behind a news article. In this paper, we propose SaRoHead, the first corpus for satire detection in Romanian multi-domain news headlines. Our findings show that the clickbait used in some non-satirical headlines significantly influences the model.

arxiv情報

著者 Mihnea-Alexandru Vîrlan,Răzvan-Alexandru Smădu,Dumitru-Clementin Cercel
発行日 2025-04-10 10:03:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク