HonestBait: Forward References for Attractive but Faithful Headline Generation

要約

魅力的な見出しを生成する現在の方法は、データから直接学習することが多く、ユーザーのクリック数や閲覧数に基づいて魅力度を決定します。
クリックやビューはユーザーの関心を反映していますが、文体によってどれだけの関心が高まっているのか、またイベントやトピック自体によってどの程度関心が高まっているのかを明らかにできない可能性があります。
また、このようなアプローチは内容を過度に誇張することで有害な発明につながり、虚偽の情報の拡散を悪化させる可能性があります。
この研究では、これらの問題を別の側面から解決するための新しいフレームワークである HonestBait を提案します。それは、クリックベイトによく使用される記述手法である前方参照 (FR) を使用して見出しを生成することです。
偽の発明を避けるために、トレーニング中に自己検証プロセスが組み込まれます。
まず、FR がユーザーの興味にどのような影響を与えるかを理解するための予備的なユーザー調査から始めます。その後、魅力的かつ忠実なニュース ヘッドラインを生成するためのフェイク ニュースと検証済みニュースのペアを含む革新的なデータセット PANCO1 を紹介します。
自動指標と人間による評価により、私たちのフレームワークは高い真実性を維持しながら、より魅力的な結果 (人間が書いた検証済みのニュース見出しと比較して +11.25%) が得られ、フェイク ニュースと戦うために本物の情報を促進するのに役立つことが示されています。

要約(オリジナル)

Current methods for generating attractive headlines often learn directly from data, which bases attractiveness on the number of user clicks and views. Although clicks or views do reflect user interest, they can fail to reveal how much interest is raised by the writing style and how much is due to the event or topic itself. Also, such approaches can lead to harmful inventions by over-exaggerating the content, aggravating the spread of false information. In this work, we propose HonestBait, a novel framework for solving these issues from another aspect: generating headlines using forward references (FRs), a writing technique often used for clickbait. A self-verification process is included during training to avoid spurious inventions. We begin with a preliminary user study to understand how FRs affect user interest, after which we present PANCO1, an innovative dataset containing pairs of fake news with verified news for attractive but faithful news headline generation. Automatic metrics and human evaluations show that our framework yields more attractive results (+11.25% compared to human-written verified news headlines) while maintaining high veracity, which helps promote real information to fight against fake news.

arxiv情報

著者 Chih-Yao Chen,Dennis Wu,Lun-Wei Ku
発行日 2023-06-26 16:34:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク