NASTyLinker: NIL-Aware Scalable Transformer-based Entity Linker

要約

エンティティ リンク (EL) は、テキスト内のエンティティの言及を検出し、それらを参照ナレッジ ベースに明確にするタスクです。
最も普及している EL アプローチは、参照知識ベースが完全であることを前提としています。
ただし、実際には、知識ベースに含まれていないエンティティ (NIL エンティティ) にリンクする場合に対処する必要があります。
最近の研究では、メンションとエンティティ間の親和性のみに焦点を当てるのではなく、メンション間の親和性を考慮して、メンションのクラスターを生成することで NIL エンティティを表すことができることが示されています。
同時に、インターメンション アフィニティは、既知のエンティティのリンク パフォーマンスを大幅に改善するのに役立ちます。
NASTyLinker では、既知のエンティティの高いリンク パフォーマンスを維持しながら、NIL エンティティを認識し、対応するメンション クラスターを生成する EL アプローチを導入します。
このアプローチは、トランスフォーマーからの密な表現に基づいて言及とエンティティーをクラスター化し、推移的な言及とエンティティーの類似性を計算することによって (複数のエンティティーがクラスターに割り当てられている場合) 競合を解決します。
NILエンティティに関してELを評価するために明示的に構築されたデータセットであるNILKに対するNASTyLinkerの有効性とスケーラビリティを示します。
さらに、提示されたアプローチを実際の EL タスク、つまりウィキペディアのリスト内のエンティティをリンクすることによってナレッジ グラフの母集団に適用し、結果の分析を提供します。

要約(オリジナル)

Entity Linking (EL) is the task of detecting mentions of entities in text and disambiguating them to a reference knowledge base. Most prevalent EL approaches assume that the reference knowledge base is complete. In practice, however, it is necessary to deal with the case of linking to an entity that is not contained in the knowledge base (NIL entity). Recent works have shown that, instead of focusing only on affinities between mentions and entities, considering inter-mention affinities can be used to represent NIL entities by producing clusters of mentions. At the same time, inter-mention affinities can help to substantially improve linking performance for known entities. With NASTyLinker, we introduce an EL approach that is aware of NIL-entities and produces corresponding mention clusters while maintaining high linking performance for known entities. The approach clusters mentions and entities based on dense representations from Transformers and resolves conflicts (if more than one entity is assigned to a cluster) by computing transitive mention-entity affinities. We show the effectiveness and scalability of NASTyLinker on NILK, a dataset that is explicitly constructed to evaluate EL with respect to NIL-entities. Further, we apply the presented approach to an actual EL task, namely to knowledge graph population by linking entities in Wikipedia listings, and provide an analysis of the outcome.

arxiv情報

著者 Nicolas Heist,Heiko Paulheim
発行日 2023-03-08 08:08:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク