要約
気候変動は世界的に重大な課題を引き起こしており、国際舞台で資源や言語表現が不足していることが多い低所得国に過度の影響を与えています。
バングラデシュは気候の影響に対して最も脆弱な国の一つであるにもかかわらず、気候変動とNLPに関連するベンガル語研究には依然として研究ギャップが残っている。
この不均衡に対処するために、ベンガル語 (バングラ) の気候変動と環境に関する新しいニュース データセットである Dhoroni を紹介します。これは、2,300 件の注釈付きバングラ ニュース記事で構成され、政治的影響力、科学的/統計的データ、信憑性、立場の検出、利害関係者などの複数の視点を提供します。
関与。
さらに、Dhoroni の詳細な探索的分析を提示し、データセットに基づいて微調整された、バングラにおける気候と環境に関する意見検出のための新しいベースライン モデル ファミリである BanglaBERT-Dhoroni ファミリーを紹介します。
この研究は、ベンガル語(バングラ)語での気候に関する議論のアクセシビリティと分析の強化に大きく貢献し、人口1億8,000万人のバングラデシュのような気候変動の影響を受ける地域における重大なコミュニケーションと研究のギャップに対処します。
要約(オリジナル)
Climate change poses critical challenges globally, disproportionately affecting low-income countries that often lack resources and linguistic representation on the international stage. Despite Bangladesh’s status as one of the most vulnerable nations to climate impacts, research gaps persist in Bengali-language studies related to climate change and NLP. To address this disparity, we introduce Dhoroni, a novel Bengali (Bangla) climate change and environmental news dataset, comprising a 2300 annotated Bangla news articles, offering multiple perspectives such as political influence, scientific/statistical data, authenticity, stance detection, and stakeholder involvement. Furthermore, we present an in-depth exploratory analysis of Dhoroni and introduce BanglaBERT-Dhoroni family, a novel baseline model family for climate and environmental opinion detection in Bangla, fine-tuned on our dataset. This research contributes significantly to enhancing accessibility and analysis of climate discourse in Bengali (Bangla), addressing crucial communication and research gaps in climate-impacted regions like Bangladesh with 180 million people.
arxiv情報
著者 | Azmine Toushik Wasi,Wahid Faisal,Taj Ahmad,Abdur Rahman,Mst Rafia Islam |
発行日 | 2024-10-22 17:47:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google