要約
共参照解決における主要な課題の 1 つは、メンションのペアではなくメンションのクラスターに対して定義されたエンティティ レベルの機能をどのように利用するかということです。
ただし、共参照の言及は通常、テキスト全体で遠く離れて分散しているため、エンティティ レベルの機能を組み込むことが非常に困難になります。
我々は、おそらく同じ現実世界のエンティティを参照しているすべての言及間での特徴の共有を促進することによって、エンティティ中心の情報をキャプチャできる、グラフ ニューラル ネットワーク ベースの共参照解決方法を提案します。
メンションは、リンクされた 2 つのメンションが同じエンティティを指す可能性をモデル化するエッジを介して相互にリンクされます。
このようなグラフによるモデル化により、メンション間の特徴をエンティティ中心の方法でメッセージ受け渡し操作によって共有できます。
言及を一貫したグループに最適にクラスタリングするために、二次特徴までのグローバル推論アルゴリズムも提供されます。
実験結果は、グラフ ニューラル ネットワーク ベースの手法と 2 次復号化アルゴリズム (GNNCR と呼ばれる) を組み合わせた手法が、英国の CoNLL-2012 共有タスク データセットで最先端に近いパフォーマンスを達成したことを示しています。
要約(オリジナル)
One of the major challenges in coreference resolution is how to make use of entity-level features defined over clusters of mentions rather than mention pairs. However, coreferent mentions usually spread far apart in an entire text, which makes it extremely difficult to incorporate entity-level features. We propose a graph neural network-based coreference resolution method that can capture the entity-centric information by encouraging the sharing of features across all mentions that probably refer to the same real-world entity. Mentions are linked to each other via the edges modeling how likely two linked mentions point to the same entity. Modeling by such graphs, the features between mentions can be shared by message passing operations in an entity-centric manner. A global inference algorithm up to second-order features is also presented to optimally cluster mentions into consistent groups. Experimental results show our graph neural network-based method combing with the second-order decoding algorithm (named GNNCR) achieved close to state-of-the-art performance on the English CoNLL-2012 Shared Task dataset.
arxiv情報
著者 | Lu Liu,Zhenqiao Song,Xiaoqing Zheng,Jun He |
発行日 | 2023-07-24 03:56:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google