Prompt-tuning for Clickbait Detection via Text Summarization

要約

クリックベイトとは、より多くのクリックをユーザーに誘導しようとする驚くべきソーシャル投稿や欺瞞的なニュースの見出しであり、より多くの利益や商業収入を得るために前例のないペースで投稿されています。
クリックベイトの蔓延はユーザーに重大な悪影響を及ぼし、ユーザーに誤解を招く攻撃、さらにはクリックジャッキング攻撃をもたらします。
フェイクニュースとは異なり、クリックベイト検出における重大な問題は、見出しが対応するコンテンツと一致するかどうかを判断することです。
既存の手法のほとんどは、クリックベイトを検出するために見出しとコンテンツの間の意味的類似性を計算します。
ただし、見出しと内容の間では長さや意味的特徴が大きく異なるため、意味的類似性を直接計算してそれらの関係を要約するのは困難なことがよくあります。
この問題に対処するために、本論文ではテキスト要約によるクリックベイト検出のプロンプトチューニング手法を提案します。テキスト要約を導入して内容を要約し、生成された要約とコンテンツの類似性に基づいてクリックベイト検出を実行します。
具体的には、まず 2 段階のテキスト要約モデルを導入して、事前トレーニングされた言語モデルに基づいて高品質のニュース要約を生成します。次に、見出しと新しく生成された要約の両方が、プロンプト チューニングの入力として組み込まれます。
さらに、クリックベイト検出のパフォーマンスを向上させるために、外部の知識を組み込むためにさまざまな戦略が実行されます。
有名なクリックベイト検出データセットに対する広範な実験により、私たちの方法が最先端のパフォーマンスを達成したことが実証されました。

要約(オリジナル)

Clickbaits are surprising social posts or deceptive news headlines that attempt to lure users for more clicks, which have posted at unprecedented rates for more profit or commercial revenue. The spread of clickbait has significant negative impacts on the users, which brings users misleading or even click-jacking attacks. Different from fake news, the crucial problem in clickbait detection is determining whether the headline matches the corresponding content. Most existing methods compute the semantic similarity between the headlines and contents for detecting clickbait. However, due to significant differences in length and semantic features between headlines and contents, directly calculating semantic similarity is often difficult to summarize the relationship between them. To address this problem, we propose a prompt-tuning method for clickbait detection via text summarization in this paper, text summarization is introduced to summarize the contents, and clickbait detection is performed based on the similarity between the generated summary and the contents. Specifically, we first introduce a two-stage text summarization model to produce high-quality news summaries based on pre-trained language models, and then both the headlines and new generated summaries are incorporated as the inputs for prompt-tuning. Additionally, a variety of strategies are conducted to incorporate external knowledge for improving the performance of clickbait detection. The extensive experiments on well-known clickbait detection datasets demonstrate that our method achieved state-of-the-art performance.

arxiv情報

著者 Haoxiang Deng,Yi Zhu,Ye Wang,Jipeng Qiang,Yunhao Yuan,Yun Li,Runmei Zhang
発行日 2024-04-17 09:39:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク