要約
警告: この文書には、一部の読者にとって不快または攻撃的な内容が含まれています。
犬笛は二重の意味を持つコード化された表現です。1 つは一般大衆向け (アウトグループ)、もう 1 つは対象となる聴衆 (イングループ) に特定のメッセージを伝えるものです。
多くの場合、これらの表現は、もっともらしい否定を維持しながら、コンテンツモデレーションフィルターをすり抜けながら、物議を醸す政治的意見を伝えるために使用されます。
犬笛の識別は厳選された辞書に依存していますが、最新の状態に保つのが困難です。
\textbf{FETCH!} という、大規模なソーシャル メディア コーパスから新しい犬笛を見つけるタスクを紹介します。
3 つの異なるソーシャル メディアのケーススタディでは、最先端のシステムでは有意義な結果が得られていないことがわかりました。
私たちは、ベクトル データベースと大規模言語モデル (LLM) の長所を組み合わせて、新しい犬笛を効率的かつ効果的に識別する新しいシステムである \textbf{EarShot} を紹介します。
要約(オリジナル)
WARNING: This paper contains content that maybe upsetting or offensive to some readers. Dog whistles are coded expressions with dual meanings: one intended for the general public (outgroup) and another that conveys a specific message to an intended audience (ingroup). Often, these expressions are used to convey controversial political opinions while maintaining plausible deniability and slip by content moderation filters. Identification of dog whistles relies on curated lexicons, which have trouble keeping up to date. We introduce \textbf{FETCH!}, a task for finding novel dog whistles in massive social media corpora. We find that state-of-the-art systems fail to achieve meaningful results across three distinct social media case studies. We present \textbf{EarShot}, a novel system that combines the strengths of vector databases and Large Language Models (LLMs) to efficiently and effectively identify new dog whistles.
arxiv情報
著者 | Kuleen Sasse,Carlos Aguirre,Isabel Cachola,Sharon Levy,Mark Dredze |
発行日 | 2024-12-16 18:46:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google