要約
テキストから時間情報を抽出する現在の主要なパラダイムは、(1) 出来事と時間表現の認識、(2) それらの間の時間関係の認識、(3) 時間関係からのタイムラインの構築の 3 つのフェーズで構成されます。
最初の 2 つのフェーズとは対照的に、最後のフェーズであるタイムラインの構築はほとんど注目されておらず、この作業の焦点です。
この論文では、(抽出された)時間関係のセットから線形タイムラインを構築する新しい方法を提案します。
しかし、より重要なのは、以前の研究のように時間的関係を予測する中間ステップを経ずに、テキストからイベントの開始点と終了点を直接予測し、タイムラインを構成する新しいパラダイムを提案することです。
このパラダイム内で、線形複雑性を予測する 2 つのモデルと、TimeML スタイルのアノテーションを使用した新しいトレーニング損失を提案し、有望な結果をもたらします。
要約(オリジナル)
The current leading paradigm for temporal information extraction from text consists of three phases: (1) recognition of events and temporal expressions, (2) recognition of temporal relations among them, and (3) time-line construction from the temporal relations. In contrast to the first two phases, the last phase, time-line construction, received little attention and is the focus of this work. In this paper, we propose a new method to construct a linear time-line from a set of (extracted) temporal relations. But more importantly, we propose a novel paradigm in which we directly predict start and end-points for events from the text, constituting a time-line without going through the intermediate step of prediction of temporal relations as in earlier work. Within this paradigm, we propose two models that predict in linear complexity, and a new training loss using TimeML-style annotations, yielding promising results.
arxiv情報
著者 | Artuur Leeuwenberg,Marie-Francine Moens |
発行日 | 2023-11-30 09:58:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google