CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media


危機に際して、ソーシャル メディア プラットフォームはコミュニケーションの促進とリソースの調整において重要な役割を果たします。
私たちは、多言語のリクエストとオファーのマッチングのためにテキスト、時間、空間の特徴を統合する体系的なアプローチである CReMa (Crisis Response Matcher) を提案します。
危機に特化した事前トレーニング済みモデルのセットである CrisisTransformers と、言語を超えた埋め込みスペースを活用することで、私たちの方法論は識別タスクと照合タスクを強化しながら、分類タスクやユニバーサル タスクにおいて RoBERTa、MPNet、BERTweet などの強力なベースラインを上回ります。
危機埋め込み生成タスクにおけるセンテンス エンコーダー、センテンス トランスフォーマー。
オーストラリアで最も一般的に使用されている 16 の言語にわたって、ソーシャル メディア上で助けを求めたり支援を提供したりするシナリオをシミュレートする、新しい多言語データセットを紹介します。
私たちは、複数のベクトル検索戦略と精度の間のトレードオフを調査しながら、これら 16 言語にわたる包括的なクロスリンガル実験を実施します。
さらに、ソーシャル メディアで助けを求めたり支援を提供したりするパターンを理解するために、100 万規模のジオタグ付きのグローバル データセットを分析しています。


During times of crisis, social media platforms play a vital role in facilitating communication and coordinating resources. Amidst chaos and uncertainty, communities often rely on these platforms to share urgent pleas for help, extend support, and organize relief efforts. However, the sheer volume of conversations during such periods, which can escalate to unprecedented levels, necessitates the automated identification and matching of requests and offers to streamline relief operations. This study addresses the challenge of efficiently identifying and matching assistance requests and offers on social media platforms during emergencies. We propose CReMa (Crisis Response Matcher), a systematic approach that integrates textual, temporal, and spatial features for multi-lingual request-offer matching. By leveraging CrisisTransformers, a set of pre-trained models specific to crises, and a cross-lingual embedding space, our methodology enhances the identification and matching tasks while outperforming strong baselines such as RoBERTa, MPNet, and BERTweet, in classification tasks, and Universal Sentence Encoder, Sentence Transformers in crisis embeddings generation tasks. We introduce a novel multi-lingual dataset that simulates scenarios of help-seeking and offering assistance on social media across the 16 most commonly used languages in Australia. We conduct comprehensive cross-lingual experiments across these 16 languages, also while examining trade-offs between multiple vector search strategies and accuracy. Additionally, we analyze a million-scale geotagged global dataset to comprehend patterns in relation to seeking help and offering assistance on social media. Overall, these contributions advance the field of crisis informatics and provide benchmarks for future research in the area.


著者 Rabindra Lamsal,Maria Rodriguez Read,Shanika Karunasekera,Muhammad Imran
発行日 2024-05-20 09:30:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク