Causal schema induction for knowledge discovery

要約

なじみのある新しい状況を理解するには、通常、因果関係のスキーマ、つまり人間が一連の出来事について推論するのに役立つストーリーについて一般化する必要があります。
イベントについての推論には、イベント インスタンス間で共有される原因と結果の関係の特定が含まれます。これは、因果スキーマ誘導と呼ばれるプロセスです。
統計的スキーマ誘導システムは、談話にコード化された構造的知識や、イベントの意味に関連付けられた因果グラフを活用する可能性がありますが、そのような因果構造を研究するためのリソースは数が少なく、サイズも限られています。
この作業では、スキーマ誘導モデルを知識発見のタスクに適用して、英語のニュース テキストの検索を強化する方法を調査します。
データ不足の問題に取り組むために、Torquestra を提示します。Torquestra は、時間、イベント、および因果構造を統合するテキスト グラフ スキーマ ユニットの手動で精選されたデータセットです。
3 つの知識発見タスクでデータセットのベンチマークを行い、それぞれのモデルを構築して評価します。
結果は、因果構造を利用するシステムは、語彙の手がかりだけに頼るのではなく、同様の因果意味コンポーネントを共有するテキストを識別するのに効果的であることを示しています。
データセットとモデルを研究目的で利用できるようにします。

要約(オリジナル)

Making sense of familiar yet new situations typically involves making generalizations about causal schemas, stories that help humans reason about event sequences. Reasoning about events includes identifying cause and effect relations shared across event instances, a process we refer to as causal schema induction. Statistical schema induction systems may leverage structural knowledge encoded in discourse or the causal graphs associated with event meaning, however resources to study such causal structure are few in number and limited in size. In this work, we investigate how to apply schema induction models to the task of knowledge discovery for enhanced search of English-language news texts. To tackle the problem of data scarcity, we present Torquestra, a manually curated dataset of text-graph-schema units integrating temporal, event, and causal structures. We benchmark our dataset on three knowledge discovery tasks, building and evaluating models for each. Results show that systems that harness causal structure are effective at identifying texts sharing similar causal meaning components rather than relying on lexical cues alone. We make our dataset and models available for research purposes.

arxiv情報

著者 Michael Regan,Jena D. Hwang,Keisuke Sakaguchi,James Pustejovsky
発行日 2023-03-27 16:55:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク