要約
見出しはニュース記事の重要な部分であり、表現力と暴露された主題へのつながりの影響を受けます。
ほとんどのニュースアウトレットは、現実を客観的に提示することを目指していますが、一部の出版物は、風刺、皮肉、皮肉のスタイルの要素が特定のトピックをカバーするためにブレンドするユーモラスなアプローチを好みます。
見出しがニュース記事の背後にある主なアイデアを公開することを目的としているため、風刺検出は難しい場合があります。
この論文では、ルーマニアのマルチドメインニュースヘッドラインでの風刺検出の最初のコーパスであるサロヘッドを提案します。
私たちの調査結果は、いくつかの非飽和の見出しで使用されているクリックベイトがモデルに大きく影響することを示しています。
要約(オリジナル)
The headline is an important part of a news article, influenced by expressiveness and connection to the exposed subject. Although most news outlets aim to present reality objectively, some publications prefer a humorous approach in which stylistic elements of satire, irony, and sarcasm blend to cover specific topics. Satire detection can be difficult because a headline aims to expose the main idea behind a news article. In this paper, we propose SaRoHead, the first corpus for satire detection in Romanian multi-domain news headlines. Our findings show that the clickbait used in some non-satirical headlines significantly influences the model.
arxiv情報
著者 | Mihnea-Alexandru Vîrlan,Răzvan-Alexandru Smădu,Dumitru-Clementin Cercel |
発行日 | 2025-04-10 10:03:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google