要約
人道活動団体にとって、歴史的または現在進行中の人権侵害をより深く理解し、そのような出来事が世界に及ぼす影響をより適切に管理するには、人権活動家に対する攻撃を時系列および場所別に遡及的に分析できることが重要です。
私たちは、NLP が大量のニュース記事のコレクションを迅速に処理して、人権活動家に対する攻撃の特徴を検出して要約することで、そのような取り組みをサポートできるのではないかと仮説を立てています。
そのために、500 のオンライン ニュース記事に対するクラウドソースの注釈から構成される、人権擁護者への攻撃 (HRDs Attack) を検出するための新しいデータセットを提案します。
注釈には、攻撃の種類と場所に関する詳細な情報、および被害者に関する情報が含まれます。
データセットを使用して、いくつかのサブタスクでベースライン モデルをトレーニングおよび評価し、注釈付きの特性を予測することによって、データセットの有用性を実証します。
要約(オリジナル)
The ability to conduct retrospective analyses of attacks on human rights defenders over time and by location is important for humanitarian organizations to better understand historical or ongoing human rights violations and thus better manage the global impact of such events. We hypothesize that NLP can support such efforts by quickly processing large collections of news articles to detect and summarize the characteristics of attacks on human rights defenders. To that end, we propose a new dataset for detecting Attacks on Human Rights Defenders (HRDsAttack) consisting of crowdsourced annotations on 500 online news articles. The annotations include fine-grained information about the type and location of the attacks, as well as information about the victim(s). We demonstrate the usefulness of the dataset by using it to train and evaluate baseline models on several sub-tasks to predict the annotated characteristics.
arxiv情報
著者 | Shihao Ran,Di Lu,Joel Tetreault,Aoife Cahill,Alejandro Jaimes |
発行日 | 2023-06-30 14:20:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google