要約
本研究では、ターゲットベースのスタンス予測のための、ブラジルポルトガル語TwitterドメインのマルチモーダルコーパスUstanceBRを紹介する。このコーパスは、選択されたターゲットトピックに対する86.8 kのラベル付きスタンスと、これらのスタンスをソーシャルメディア上で公開したユーザーに関する広範なネットワーク情報から構成される。本稿では、コーパスのマルチモーダルデータと、テキストおよびネットワーク関連情報に基づくドメイン内スタンス予測およびゼロショットスタンス予測における多くの使用例について述べる。
要約(オリジナル)
This work introduces UstanceBR, a multimodal corpus in the Brazilian Portuguese Twitter domain for target-based stance prediction. The corpus comprises 86.8 k labelled stances towards selected target topics, and extensive network information about the users who published these stances on social media. In this article we describe the corpus multimodal data, and a number of usage examples in both in-domain and zero-shot stance prediction based on text- and network-related information, which are intended to provide initial baseline results for future studies in the field.
arxiv情報
著者 | Camila Pereira,Matheus Pavan,Sungwon Yoon,Ricelli Ramos,Pablo Costa,Lais Cavalheiro,Ivandre Paraboni |
発行日 | 2024-01-04 10:12:18+00:00 |
arxivサイト | arxiv_id(pdf) |