Leveraging BERT Language Models for Multi-Lingual ESG Issue Identification

要約

環境、社会、ガバナンス (ESG) は、環境、社会、ガバナンスなどの分野における企業のマイナスの影響を測定し、プラスの成果を高めるための指標として使用されています。
最近、投資家は投資選択における ESG 基準の重要性をますます認識しており、企業は ESG 原則を自社の事業や戦略に組み込むようになってきています。
多言語 ESG 問題特定 (ML-ESG) 共有タスクには、ニュース文書を 35 の異なる ESG 問題ラベルに分類することが含まれます。
この研究では、BERT 言語モデルを利用して、これらのラベル全体でニュース文書を正確に分類するための複数の戦略を検討しました。
私たちの分析により、RoBERTa 分類器が最も成功したアプローチの 1 つとして浮上し、英語のテスト データセットで 2 位の位置を確保し、フランス語のテスト データセットで 5 位の位置を共有したことが明らかになりました。
さらに、中国語用に調整された SVM ベースのバイナリ モデルは、優れたパフォーマンスを示し、テスト データセットで 2 位のランクを獲得しました。

要約(オリジナル)

Environmental, Social, and Governance (ESG) has been used as a metric to measure the negative impacts and enhance positive outcomes of companies in areas such as the environment, society, and governance. Recently, investors have increasingly recognized the significance of ESG criteria in their investment choices, leading businesses to integrate ESG principles into their operations and strategies. The Multi-Lingual ESG Issue Identification (ML-ESG) shared task encompasses the classification of news documents into 35 distinct ESG issue labels. In this study, we explored multiple strategies harnessing BERT language models to achieve accurate classification of news documents across these labels. Our analysis revealed that the RoBERTa classifier emerged as one of the most successful approaches, securing the second-place position for the English test dataset, and sharing the fifth-place position for the French test dataset. Furthermore, our SVM-based binary model tailored for the Chinese language exhibited exceptional performance, earning the second-place rank on the test dataset.

arxiv情報

著者 Elvys Linhares Pontes,Mohamed Benjannet,Lam Kim Ming
発行日 2023-09-05 12:48:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク