Causal schema induction for knowledge discovery


イベントについての推論には、イベント インスタンス間で共有される原因と結果の関係の特定が含まれます。これは、因果スキーマ誘導と呼ばれるプロセスです。
この作業では、スキーマ誘導モデルを知識発見のタスクに適用して、英語のニュース テキストの検索を強化する方法を調査します。
データ不足の問題に取り組むために、Torquestra を提示します。Torquestra は、時間、イベント、および因果構造を統合するテキスト グラフ スキーマ ユニットの手動で精選されたデータセットです。
3 つの知識発見タスクでデータセットのベンチマークを行い、それぞれのモデルを構築して評価します。


Making sense of familiar yet new situations typically involves making generalizations about causal schemas, stories that help humans reason about event sequences. Reasoning about events includes identifying cause and effect relations shared across event instances, a process we refer to as causal schema induction. Statistical schema induction systems may leverage structural knowledge encoded in discourse or the causal graphs associated with event meaning, however resources to study such causal structure are few in number and limited in size. In this work, we investigate how to apply schema induction models to the task of knowledge discovery for enhanced search of English-language news texts. To tackle the problem of data scarcity, we present Torquestra, a manually curated dataset of text-graph-schema units integrating temporal, event, and causal structures. We benchmark our dataset on three knowledge discovery tasks, building and evaluating models for each. Results show that systems that harness causal structure are effective at identifying texts sharing similar causal meaning components rather than relying on lexical cues alone. We make our dataset and models available for research purposes.


著者 Michael Regan,Jena D. Hwang,Keisuke Sakaguchi,James Pustejovsky
発行日 2023-03-27 16:55:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク