Zero-Shot On-the-Fly Event Schema Induction

要約

パンデミックの発生に関与するイベントは何ですか?
結婚式を計画するときは、どのような手順を踏む必要がありますか?
これらの質問に対する答えは、関心のある複雑なイベントに関する多くのドキュメントを収集し、関連情報を抽出して分析することによって見つけることができます。
大規模な言語モデルを利用してソース ドキュメントを生成する新しいアプローチを提示します。ソース ドキュメントは、高レベルのイベント定義、特定のイベント、引数、およびイベント間の関係を予測して、複雑なイベント全体を記述するスキーマを構築できるようにします。
.
私たちのモデルを使用すると、手動でデータを収集することなく、つまりゼロショット方式で、あらゆるトピックの完全なスキーマをオンザフライで生成できます。
さらに、テキストから適切な情報を抽出する効率的な方法を開発し、一連の実験で、調査したシナリオの大部分で、これらのスキーマが人間がキュレーションしたスキーマよりも完全であると見なされることを実証しました。
最後に、このフレームワークは、事前定義されたオントロジーを必要とせずに、より一般的で柔軟でありながら、実際のテキストの収集に依存する以前の教師付きスキーマ誘導方法とパフォーマンスが同等であることを示します。

要約(オリジナル)

What are the events involved in a pandemic outbreak? What steps should be taken when planning a wedding? The answers to these questions can be found by collecting many documents on the complex event of interest, extracting relevant information, and analyzing it. We present a new approach in which large language models are utilized to generate source documents that allow predicting, given a high-level event definition, the specific events, arguments, and relations between them to construct a schema that describes the complex event in its entirety. Using our model, complete schemas on any topic can be generated on-the-fly without any manual data collection, i.e., in a zero-shot manner. Moreover, we develop efficient methods to extract pertinent information from texts and demonstrate in a series of experiments that these schemas are considered to be more complete than human-curated ones in the majority of examined scenarios. Finally, we show that this framework is comparable in performance with previous supervised schema induction methods that rely on collecting real texts while being more general and flexible without the need for a predefined ontology.

arxiv情報

著者 Rotem Dror,Haoyu Wang,Dan Roth
発行日 2023-03-27 14:11:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク