Constructing and Interpreting Causal Knowledge Graphs from News

要約

多くの仕事は、過去と現在の因果関係を知り、情報に基づいた意思決定を行い、将来について予測するためにニュースに依存しています。
インターネット上で入手できるニュースやテキストの量が増え続けるにつれて、非構造化テキストから因果関係のイベントを抽出する作業を自動化する必要があります。
この研究では、(1) 因果関係の抽出、および (2) 議論のクラスタリングと KG への表現の 2 つのステップを使用して、ニュースから因果知識グラフ (KG) を構築する方法論を提案します。
私たちは、再現性、精度、解釈可能性を重視したグラフを構築することを目指しています。
抽出に関しては、初期の研究の多くがすでにテキストから因果関係の KG を構築していますが、ほとんどは初歩的なパターンベースの方法を採用しています。
私たちは、最新の BERT ベースの抽出モデルとパターンベースの抽出モデルを併用することで、このギャップを埋めています。
その結果、高い精度を維持しながら、高い再現率を実現しました。
クラスタリングでは、トピック モデリング アプローチを利用して議論をクラスタリングし、グラフの接続性を高めました。
その結果、15,686 個の切断されたサブグラフの代わりに、ユーザーがより多くの因果関係を推測できる 1 つの接続されたグラフを取得することができました。
私たちの最終的な KG は、複数のユースケースとユーザーのフィードバックを通じて検証された因果関係を効果的に捉えて伝えます。

要約(オリジナル)

Many jobs rely on news to learn about causal events in the past and present, to make informed decisions and predictions about the future. With the ever-increasing amount of news and text available on the internet, there is a need to automate the extraction of causal events from unstructured texts. In this work, we propose a methodology to construct causal knowledge graphs (KGs) from news using two steps: (1) Extraction of Causal Relations, and (2) Argument Clustering and Representation into KG. We aim to build graphs that emphasize on recall, precision and interpretability. For extraction, although many earlier works already construct causal KGs from text, most adopt rudimentary pattern-based methods. We close this gap by using the latest BERT-based extraction models alongside pattern-based ones. As a result, we achieved a high recall, while still maintaining a high precision. For clustering, we utilized a topic modelling approach to cluster our arguments, so as to increase the connectivity of our graph. As a result, instead of 15,686 disconnected subgraphs, we were able to obtain 1 connected graph that enables users to infer more causal relationships from. Our final KG effectively captures and conveys causal relationships, validated through multiple use cases and user feedback.

arxiv情報

著者 Fiona Anting Tan,Debdeep Paul,Sahim Yamaura,Miura Koji,See-Kiong Ng
発行日 2023-05-16 11:33:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク