DIVERSE: A Dataset of YouTube Video Comment Stances with a Data Programming Model

要約

ソーシャル メディア テキストのスタンス検出は、マーケティング キャンペーンの評価、政治政策や候補者の評価、情報環境の評価など、多​​くの実世界のアプリケーションの重要なコンポーネントです。
ただし、自動スタンスラベル付けシステムを作成するには、スタンスに手動で注釈を付ける必要があり、面倒でリソースを大量に消費します。
この論文では、文章のトーンの弱い信号を利用し、これらの信号をデータ プログラミング モデルで統合して最終的なスタンス ラベルを作成するスタンス ラベリング手法を紹介します。
国際紛争の時代においては、自国の軍隊に対する世論を理解することが採用において極めて重要です。
私たちは、米軍の YouTube 動画に対するスタンスを含むデータセットである DIVERSE を紹介します (データセットは https://doi.org/10.5281/zenodo.10493803 で入手可能)。
平均すると、各動画には 200 件のコメントが付いており、米軍と動画の両方の立場は「反対」の特徴付けにわずかに偏っています。

要約(オリジナル)

Stance detection of social media text is a key component of many real-world applications like evaluating marketing campaigns, evaluating political policies or candidates, or evaluating information environments. However, creating automatic stance labeling systems requires the manual annotation of stances, which is both tedious and resource-intensive. This paper introduces a stance labeling method that makes use of weak signals of sentence tone, then consolidating these signals with a Data Programmingmodel for the final stance label. In a time of international conflict, understanding the public opinion towards the country’s military is crucial for recruitment. We present DIVERSE, a dataset involve stances towards YouTube videos of the US military (Dataset available at https://doi.org/10.5281/zenodo.10493803). On average, the videos have 200 comments each, and the stances skew slightly towards the ‘against’ characterization for both the US army and the video.

arxiv情報

著者 Iain J. Cruickshank,Amir Soofi,Lynnette Hui Xian Ng
発行日 2024-08-27 17:46:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク