要約
この研究では、ターゲット ベースのスタンス予測のためのブラジル ポルトガル語 Twitter ドメインのマルチモーダル コーパスである UstanceBR を導入しています。
このコーパスは、選択されたターゲット トピックに対する 86.8 k のラベル付きスタンスと、ソーシャル メディア上でこれらのスタンスを公開したユーザーに関する広範なネットワーク情報で構成されています。
この記事では、コーパス マルチモーダル データと、テキストおよびネットワーク関連情報に基づくドメイン内およびゼロショット スタンス予測の両方における多数の使用例について説明します。これらは、将来の研究のための初期ベースライン結果を提供することを目的としています。
分野。
要約(オリジナル)
This work introduces UstanceBR, a multimodal corpus in the Brazilian Portuguese Twitter domain for target-based stance prediction. The corpus comprises 86.8 k labelled stances towards selected target topics, and extensive network information about the users who published these stances on social media. In this article we describe the corpus multimodal data, and a number of usage examples in both in-domain and zero-shot stance prediction based on text- and network-related information, which are intended to provide initial baseline results for future studies in the field.
arxiv情報
著者 | Camila Pereira,Matheus Pavan,Sungwon Yoon,Ricelli Ramos,Pablo Costa,Lais Cavalheiro,Ivandre Paraboni |
発行日 | 2024-11-11 14:28:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google