要約
イベントスキーマは、イベントを表現し、世界のイベント知識をモデル化するための概念的、構造的、形式的な言語を提供します。しかし、実世界のイベントのオープンな性質、イベント表現の多様性、イベント知識の希薄さなどから、高品質でカバー率の高いイベントスキーマを自動的に誘導することは困難である。本論文では、PLMからイベントスキーマを発見し、概念化し、構造化することで、上記の課題を効果的に解決できる、イベントスキーマ誘導の新しいパラダイム–大規模な事前学習済み言語モデルからの知識刈り取り–を提案します。また、イベントスキーマハーベスタ(ESHer)は、インコンテキスト生成に基づく概念化、信頼性を考慮したスキーマ構造化、グラフベースのスキーマ集約によって、高品質なイベントスキーマを自動的に誘導するように設計されている。ESHerは、様々なドメインにおいて、高品質で網羅性の高いイベントスキーマを誘導できることが実証された。
要約(オリジナル)
Event schema provides a conceptual, structural and formal language to represent events and model the world event knowledge. Unfortunately, it is challenging to automatically induce high-quality and high-coverage event schemas due to the open nature of real-world events, the diversity of event expressions, and the sparsity of event knowledge. In this paper, we propose a new paradigm for event schema induction — knowledge harvesting from large-scale pre-trained language models, which can effectively resolve the above challenges by discovering, conceptualizing and structuralizing event schemas from PLMs. And an Event Schema Harvester (ESHer) is designed to automatically induce high-quality event schemas via in-context generation-based conceptualization, confidence-aware schema structuralization and graph-based schema aggregation. Empirical results show that ESHer can induce high-quality and high-coverage event schemas on varying domains.
arxiv情報
著者 | Jialong Tang,Hongyu Lin,Zhuoqun Li,Yaojie Lu,Xianpei Han,Le Sun |
発行日 | 2023-05-12 06:51:05+00:00 |
arxivサイト | arxiv_id(pdf) |