Constructing and Interpreting Causal Knowledge Graphs from News


この研究では、(1) 因果関係の抽出、および (2) 議論のクラスタリングと KG への表現の 2 つのステップを使用して、ニュースから因果知識グラフ (KG) を構築する方法論を提案します。
抽出に関しては、初期の研究の多くがすでにテキストから因果関係の KG を構築していますが、ほとんどは初歩的なパターンベースの方法を採用しています。
私たちは、最新の BERT ベースの抽出モデルとパターンベースの抽出モデルを併用することで、このギャップを埋めています。
クラスタリングでは、トピック モデリング アプローチを利用して議論をクラスタリングし、グラフの接続性を高めました。
その結果、15,686 個の切断されたサブグラフの代わりに、ユーザーがより多くの因果関係を推測できる 1 つの接続されたグラフを取得することができました。
私たちの最終的な KG は、複数のユースケースとユーザーのフィードバックを通じて検証された因果関係を効果的に捉えて伝えます。


Many jobs rely on news to learn about causal events in the past and present, to make informed decisions and predictions about the future. With the ever-increasing amount of news and text available on the internet, there is a need to automate the extraction of causal events from unstructured texts. In this work, we propose a methodology to construct causal knowledge graphs (KGs) from news using two steps: (1) Extraction of Causal Relations, and (2) Argument Clustering and Representation into KG. We aim to build graphs that emphasize on recall, precision and interpretability. For extraction, although many earlier works already construct causal KGs from text, most adopt rudimentary pattern-based methods. We close this gap by using the latest BERT-based extraction models alongside pattern-based ones. As a result, we achieved a high recall, while still maintaining a high precision. For clustering, we utilized a topic modelling approach to cluster our arguments, so as to increase the connectivity of our graph. As a result, instead of 15,686 disconnected subgraphs, we were able to obtain 1 connected graph that enables users to infer more causal relationships from. Our final KG effectively captures and conveys causal relationships, validated through multiple use cases and user feedback.


著者 Fiona Anting Tan,Debdeep Paul,Sahim Yamaura,Miura Koji,See-Kiong Ng
発行日 2023-05-16 11:33:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク