Glitter or Gold? Deriving Structured Insights from Sustainability Reports via Large Language Models


過去10年間で、投資家の環境・社会・ガバナンス(ESG)問題への関心の高まりを受けて、いくつかの規制機関が上場企業に非財務情報の開示を求めるようになった。このような情報は、非構造的で多様な文書で公開されている。そのため、企業や市場全体のサステナビリティ慣行に関する洞察を深めるために、こうしたデータをまとまった枠組みで集約・統合することは容易ではない。このような前提に立てば、利害関係者に簡潔で有益かつ実用的なデータを提供するために、情報抽出(IE)技術に頼るのは自然なことである。本研究では、従来のテキスト処理技術の枠を超えて、ラージ・ランゲージ・モデル(Large Language Models:LLM)を活用し、著名な文脈内学習技術やRetrieved Augmented Generation(RAG)パラダイムとともに、企業のサステナビリティ・レポートから意味的に構造化されたESG関連情報を抽出する。その後、グラフベースの表現を採用し、企業がサステナビリティ・レポートで開示したESG関連アクションに関する意味のある統計分析、類似性分析、相関性分析を実施した。これらの分析により、企業は認識、コンプライアンス、パートナーシップを含む複数の行動を通じてESG関連課題に取り組んでいることが明らかになり、ESG関連課題に取り組むために必要な複雑さと共同努力が浮き彫りになった。さらに、同じ地域やセクターの企業間では、情報開示の類似性が浮かび上がった。最後に、調査結果とその他の企業情報を用いて、どの事実が企業のESGスコアに最も影響を与えるかを調査した。この分析により、企業の情報開示が他の財務的特徴や企業特徴よりもESGスコアに影響を与えることが明らかになった。


Over the last decade, several regulatory bodies have started requiring the disclosure of non-financial information from publicly listed companies, in light of the investors’ increasing attention to Environmental, Social, and Governance (ESG) issues. Such information is publicly released in a variety of non-structured and multi-modal documentation. Hence, it is not straightforward to aggregate and consolidate such data in a cohesive framework to further derive insights about sustainability practices across companies and markets. Given these premises, it is natural to resort to Information Extraction (IE) techniques to provide concise, informative, and actionable data to the stakeholders. Moving beyond traditional text processing techniques, in this work we leverage Large Language Models (LLMs), along with the prominent in-context learning technique and the Retrieved Augmented Generation (RAG) paradigm, to extract semantically structured ESG-related information from companies’ sustainability reports. We then adopt graph-based representations to conduct meaningful statistical, similarity and correlation analyses concerning the ESG-related actions disclosed by companies in their sustainability reports. These analyses unveiled that companies address ESG-related issues through several actions encompassing recognition, compliance, and partnerships; highlighting the complexity and joint efforts needed to address them. Moreover, disclosure similarities emerged among companies from the same region or sector. Lastly, we investigate which factual aspects impact the most on companies’ ESG scores using our findings and other company information. This analysis unveiled that companies’ disclosures affect ESG scores more than other financial or company characteristics.


著者 Marco Bronzini,Carlo Nicolini,Bruno Lepri,Andrea Passerini,Jacopo Staiano
発行日 2023-11-03 10:43:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.CE, cs.CL, cs.CY パーマリンク