CReMa: Crisis Response through Computational Identification and Matching of Cross-Lingual Requests and Offers Shared on Social Media

要約

危機に際して、ソーシャル メディア プラットフォームはコミュニケーションの促進とリソースの調整において重要な役割を果たします。
混乱と不確実性のさなか、コミュニティはしばしばこれらのプラットフォームに依存して、助けを求める緊急の嘆願を共有し、支援を拡大し、救援活動を組織しています。
ただし、このような期間中の膨大な量の会話は前例のないレベルにまでエスカレートする可能性があるため、救援活動を合理化するために、要求と申し出の自動識別と照合が必要になります。
この研究は、緊急時にソーシャルメディアプラットフォーム上で支援リクエストとオファーを効率的に特定してマッチングするという課題に取り組んでいます。
私たちは、多言語のリクエストとオファーのマッチングのためにテキスト、時間、空間の特徴を統合する体系的なアプローチである CReMa (Crisis Response Matcher) を提案します。
危機に特化した事前トレーニング済みモデルのセットである CrisisTransformers と、言語を超えた埋め込みスペースを活用することで、私たちの方法論は識別タスクと照合タスクを強化しながら、分類タスクやユニバーサル タスクにおいて RoBERTa、MPNet、BERTweet などの強力なベースラインを上回ります。
危機埋め込み生成タスクにおけるセンテンス エンコーダー、センテンス トランスフォーマー。
オーストラリアで最も一般的に使用されている 16 の言語にわたって、ソーシャル メディア上で助けを求めたり支援を提供したりするシナリオをシミュレートする、新しい多言語データセットを紹介します。
私たちは、複数のベクトル検索戦略と精度の間のトレードオフを調査しながら、これら 16 言語にわたる包括的なクロスリンガル実験を実施します。
さらに、ソーシャル メディアで助けを求めたり支援を提供したりするパターンを理解するために、100 万規模のジオタグ付きのグローバル データセットを分析しています。
全体として、これらの貢献は危機情報学の分野を前進させ、この分野における将来の研究のベンチマークを提供します。

要約(オリジナル)

During times of crisis, social media platforms play a vital role in facilitating communication and coordinating resources. Amidst chaos and uncertainty, communities often rely on these platforms to share urgent pleas for help, extend support, and organize relief efforts. However, the sheer volume of conversations during such periods, which can escalate to unprecedented levels, necessitates the automated identification and matching of requests and offers to streamline relief operations. This study addresses the challenge of efficiently identifying and matching assistance requests and offers on social media platforms during emergencies. We propose CReMa (Crisis Response Matcher), a systematic approach that integrates textual, temporal, and spatial features for multi-lingual request-offer matching. By leveraging CrisisTransformers, a set of pre-trained models specific to crises, and a cross-lingual embedding space, our methodology enhances the identification and matching tasks while outperforming strong baselines such as RoBERTa, MPNet, and BERTweet, in classification tasks, and Universal Sentence Encoder, Sentence Transformers in crisis embeddings generation tasks. We introduce a novel multi-lingual dataset that simulates scenarios of help-seeking and offering assistance on social media across the 16 most commonly used languages in Australia. We conduct comprehensive cross-lingual experiments across these 16 languages, also while examining trade-offs between multiple vector search strategies and accuracy. Additionally, we analyze a million-scale geotagged global dataset to comprehend patterns in relation to seeking help and offering assistance on social media. Overall, these contributions advance the field of crisis informatics and provide benchmarks for future research in the area.

arxiv情報

著者 Rabindra Lamsal,Maria Rodriguez Read,Shanika Karunasekera,Muhammad Imran
発行日 2024-05-20 09:30:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク