Evolution of ESG-focused DLT Research: An NLP Analysis of the Literature

要約

分散型台帳テクノロジー (DLT) は急速に進化しており、その多様なコンポーネントに対する包括的な洞察が必要です。
しかし、DLT の環境、持続可能性、ガバナンス (ESG) 要素を強調する系統的な文献レビューは依然として不足しています。
このギャップを埋めるために、私たちは 107 のシード論文を選択して 63,083 件の参考文献の引用ネットワークを構築し、分析のためにそれを 24,539 件の出版物のコーパスに絞り込みました。
次に、確立されたテクノロジー分類法から派生した 12 のトップレベル カテゴリに従って 46 件の論文の名前付きエンティティにラベルを付け、DLT の ESG 要素を正確に特定することで分類法を強化しました。
トランスフォーマーベースの言語モデルを活用し、ラベル付きデータセットを使用して、固有表現認識 (NER) タスク用に事前トレーニングされた言語モデルを微調整しました。
私たちは、微調整された言語モデルを使用してコーパスを 505 の主要論文に抽出し、名前付きエンティティによる文献レビューと、ESG の文脈における DLT の進化に関する時間グラフ分析を容易にしました。
私たちの貢献は、ESG の側面に特に重点を置き、DLT 分野における機械学習主導の体系的な文献レビューを実施するための方法論です。
さらに、DLT および ESG 関連の探査用に設計された、54,808 の名前付きエンティティで構成される、この種初の NER データセットを紹介します。

要約(オリジナル)

Distributed Ledger Technologies (DLTs) have rapidly evolved, necessitating comprehensive insights into their diverse components. However, a systematic literature review that emphasizes the Environmental, Sustainability, and Governance (ESG) components of DLT remains lacking. To bridge this gap, we selected 107 seed papers to build a citation network of 63,083 references and refined it to a corpus of 24,539 publications for analysis. Then, we labeled the named entities in 46 papers according to twelve top-level categories derived from an established technology taxonomy and enhanced the taxonomy by pinpointing DLT’s ESG elements. Leveraging transformer-based language models, we fine-tuned a pre-trained language model for a Named Entity Recognition (NER) task using our labeled dataset. We used our fine-tuned language model to distill the corpus to 505 key papers, facilitating a literature review via named entities and temporal graph analysis on DLT evolution in the context of ESG. Our contributions are a methodology to conduct a machine learning-driven systematic literature review in the DLT field, placing a special emphasis on ESG aspects. Furthermore, we present a first-of-its-kind NER dataset, composed of 54,808 named entities, designed for DLT and ESG-related explorations.

arxiv情報

著者 Walter Hernandez,Kamil Tylinski,Alastair Moore,Niall Roche,Nikhil Vadgama,Horst Treiblmaier,Jiangbo Shangguan,Paolo Tasca,Jiahua Xu
発行日 2023-08-23 20:42:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.LG パーマリンク