要約
イベントの説明を理解することは言語処理の中心的な側面ですが、現在のアプローチは圧倒的に単一の文または文書に焦点を当てています。
イベントに関する情報を \emph{複数のドキュメントにわたって} 集約すると、より深い理解が得られます。
この目的を達成するために、私たちは、ある出来事について \emph{報告}するウィキペディアの文章の新しいコーパスである FAMuS を、同じ出来事に関する基礎となるジャンルの多様な (ウィキペディア以外の) \emph{ソース} 記事と組み合わせて提供します。
レポートとソースの両方のイベントと (クロスセンテンス) 引数には FrameNet に対して注釈が付けられ、さまざまなイベント タイプを幅広くカバーします。
FAMuS によって可能になった 2 つの重要なイベント理解タスクに関する結果を示します。 \emph{ソース検証} — 文書がターゲット レポート イベントの有効なソースであるかどうかを判断する — と \emph{クロスドキュメント引数抽出} — 完全-
レポートと正しいソース記事の両方からターゲット イベントのドキュメント引数を抽出します。
さらなる研究をサポートするために、FAMuS とモデルの両方をリリースします。
要約(オリジナル)
Understanding event descriptions is a central aspect of language processing, but current approaches focus overwhelmingly on single sentences or documents. Aggregating information about an event \emph{across documents} can offer a much richer understanding. To this end, we present FAMuS, a new corpus of Wikipedia passages that \emph{report} on some event, paired with underlying, genre-diverse (non-Wikipedia) \emph{source} articles for the same event. Events and (cross-sentence) arguments in both report and source are annotated against FrameNet, providing broad coverage of different event types. We present results on two key event understanding tasks enabled by FAMuS: \emph{source validation} — determining whether a document is a valid source for a target report event — and \emph{cross-document argument extraction} — full-document argument extraction for a target event from both its report and the correct source article. We release both FAMuS and our models to support further research.
arxiv情報
著者 | Siddharth Vashishtha,Alexander Martin,William Gantt,Benjamin Van Durme,Aaron Steven White |
発行日 | 2023-11-09 18:57:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google