UstanceBR: a social media language resource for stance prediction

要約

この研究では、ターゲット ベースのスタンス予測のためのブラジル ポルトガル語 Twitter ドメインのマルチモーダル コーパスである UstanceBR を導入しています。
このコーパスは、選択されたターゲット トピックに対する 86.8 k のラベル付きスタンスと、ソーシャル メディア上でこれらのスタンスを公開したユーザーに関する広範なネットワーク情報で構成されています。
この記事では、コーパス マルチモーダル データと、テキストおよびネットワーク関連情報に基づくドメイン内およびゼロショット スタンス予測の両方における多数の使用例について説明します。これらは、将来の研究のための初期ベースライン結果を提供することを目的としています。
分野。

要約(オリジナル)

This work introduces UstanceBR, a multimodal corpus in the Brazilian Portuguese Twitter domain for target-based stance prediction. The corpus comprises 86.8 k labelled stances towards selected target topics, and extensive network information about the users who published these stances on social media. In this article we describe the corpus multimodal data, and a number of usage examples in both in-domain and zero-shot stance prediction based on text- and network-related information, which are intended to provide initial baseline results for future studies in the field.

arxiv情報

著者 Camila Pereira,Matheus Pavan,Sungwon Yoon,Ricelli Ramos,Pablo Costa,Lais Cavalheiro,Ivandre Paraboni
発行日 2024-11-11 14:28:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク