FAMuS: Frames Across Multiple Sources

要約

イベントの説明を理解することは言語処理の中心的な側面ですが、現在のアプローチは圧倒的に単一の文または文書に焦点を当てています。
イベントに関する情報を \emph{複数のドキュメントにわたって} 集約すると、より深い理解が得られます。
この目的を達成するために、私たちは、ある出来事について \emph{報告}するウィキペディアの文章の新しいコーパスである FAMuS を、同じ出来事に関する基礎となるジャンルの多様な (ウィキペディア以外の) \emph{ソース} 記事と組み合わせて提供します。
レポートとソースの両方のイベントと (クロスセンテンス) 引数には FrameNet に対して注釈が付けられ、さまざまなイベント タイプを幅広くカバーします。
FAMuS によって可能になった 2 つの重要なイベント理解タスクに関する結果を示します。 \emph{ソース検証} — 文書がターゲット レポート イベントの有効なソースであるかどうかを判断する — と \emph{クロスドキュメント引数抽出} — 完全-
レポートと正しいソース記事の両方からターゲット イベントのドキュメント引数を抽出します。
さらなる研究をサポートするために、FAMuS とモデルの両方をリリースします。

要約(オリジナル)

Understanding event descriptions is a central aspect of language processing, but current approaches focus overwhelmingly on single sentences or documents. Aggregating information about an event \emph{across documents} can offer a much richer understanding. To this end, we present FAMuS, a new corpus of Wikipedia passages that \emph{report} on some event, paired with underlying, genre-diverse (non-Wikipedia) \emph{source} articles for the same event. Events and (cross-sentence) arguments in both report and source are annotated against FrameNet, providing broad coverage of different event types. We present results on two key event understanding tasks enabled by FAMuS: \emph{source validation} — determining whether a document is a valid source for a target report event — and \emph{cross-document argument extraction} — full-document argument extraction for a target event from both its report and the correct source article. We release both FAMuS and our models to support further research.

arxiv情報

著者 Siddharth Vashishtha,Alexander Martin,William Gantt,Benjamin Van Durme,Aaron Steven White
発行日 2023-11-09 18:57:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク