要約
スタンス検出は、テキストの作成者が特定のターゲットに対して賛成か反対か中立かを判断し、ソーシャル メディアに関する貴重な洞察を得るために使用できます。
ターゲットの間接参照が遍在しているため、意味論的特徴をモデル化し、リテラルステートメントから対応する意味を推測するための計算ソリューションが必要となるため、このタスクは困難になります。
さらに、データ駆動型のアプローチは表面的な機能やドメイン固有の機能に依存する傾向があるため、利用可能なトレーニング データの量が限られているため、ドメイン外およびクロスターゲットのシナリオではパフォーマンスが標準以下になります。
この研究では、スタンス検出タスクを言語的な観点から分解し、このタスクの主要なコンポーネントと推論パスを調査します。
スタンス トライアングルは、人々が自分のスタンスを表現する基本的な方法を説明するために以前に提案された一般的な言語フレームワークです。
明示的なオブジェクトと暗黙的なオブジェクトの間の関係を特徴付けることで、それをさらに拡張します。
次に、フレームワークを使用して、追加の注釈を付けて 1 つのトレーニング コーパスを拡張します。
実験結果は、戦略的に強化されたデータにより、ドメイン外およびクロスターゲット評価のパフォーマンスが大幅に向上する可能性があることを示しています。
要約(オリジナル)
Stance detection determines whether the author of a piece of text is in favor of, against, or neutral towards a specified target, and can be used to gain valuable insights into social media. The ubiquitous indirect referral of targets makes this task challenging, as it requires computational solutions to model semantic features and infer the corresponding implications from a literal statement. Moreover, the limited amount of available training data leads to subpar performance in out-of-domain and cross-target scenarios, as data-driven approaches are prone to rely on superficial and domain-specific features. In this work, we decompose the stance detection task from a linguistic perspective, and investigate key components and inference paths in this task. The stance triangle is a generic linguistic framework previously proposed to describe the fundamental ways people express their stance. We further expand it by characterizing the relationship between explicit and implicit objects. We then use the framework to extend one single training corpus with additional annotation. Experimental results show that strategically-enriched data can significantly improve the performance on out-of-domain and cross-target evaluation.
arxiv情報
著者 | Zhengyuan Liu,Yong Keong Yap,Hai Leong Chieu,Nancy F. Chen |
発行日 | 2023-05-31 13:33:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google