要約
ソーシャルメディアでの議論は「政治的スペクトルの反対側が使用する一見似たような言葉」で構成されていることが多く、それはしばしばまったく対照的な視点に翻訳されます。
たとえば、「思いと祈り」は、銃乱射事件の犠牲者への同情を表明したり、この問題に対する立法措置の欠如を批判したりする可能性があります。
この論文では、計算環境におけるこのような曖昧なステートメントを完全に理解し、それらを現実世界の実体、行動、態度に根ざしたものにするために必要なコンテキストを定義します。
私たちは、テキストの現実世界のコンテキストの理解を必要とする 2 つの困難なデータセットを提案します。
これらのデータセットを、RoBERTa や GPT-3 などの大規模な事前トレーニング済みモデルに基づいて構築されたモデルに対してベンチマークします。
さらに、既存の談話文脈化フレームワークと政治的行為者表現モデルに基づいて構築された、より構造化されたモデルを開発し、ベンチマークします。
私たちはデータセットと予測を分析して、提案されている社会的基礎付けタスクによってもたらされる実際的な言語理解の課題についてさらに洞察を深めます。
要約(オリジナル)
Social media discourse frequently consists of ‘seemingly similar language used by opposing sides of the political spectrum’, often translating to starkly contrasting perspectives. E.g., ‘thoughts and prayers’, could express sympathy for mass-shooting victims, or criticize the lack of legislative action on the issue. This paper defines the context required to fully understand such ambiguous statements in a computational setting and ground them in real-world entities, actions, and attitudes. We propose two challenging datasets that require an understanding of the real-world context of the text. We benchmark these datasets against models built upon large pre-trained models, such as RoBERTa and GPT-3. Additionally, we develop and benchmark more structured models building upon existing Discourse Contextualization Framework and Political Actor Representation models. We analyze the datasets and the predictions to obtain further insights into the pragmatic language understanding challenges posed by the proposed social grounding tasks.
arxiv情報
著者 | Rajkumar Pujari,Chengfei Wu,Dan Goldwasser |
発行日 | 2024-02-26 09:34:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google