An Autoregressive Text-to-Graph Framework for Joint Entity and Relation Extraction

要約

本論文では、非構造化テキストを条件付きシーケンス生成問題としてフレーム化することにより、結合エンティティと関係を抽出するための新しい方法を提案します。
左から右へのトークンレベルのジェネレーターである従来の生成情報抽出モデルとは対照的に、私たちのアプローチは \textit{スパンベース} です。
ノードがテキスト スパンを表し、エッジが関係トリプレットを表す線形化されたグラフを生成します。
私たちの方法では、スパンと関係タイプの動的語彙に対するポインティング メカニズムを備えたトランスフォーマー エンコーダー/デコーダー アーキテクチャを採用しています。
私たちのモデルは、スパン表現を通じてエンティティと関係の構造的特徴と境界をキャプチャすると同時に、ポインティング メカニズムのおかげで、生成された出力を元のテキストに根付かせることができます。
ベンチマーク データセットの評価により、当社のアプローチの有効性が検証され、競争力のある結果が実証されます。
コードは https://github.com/urchade/ATG で入手できます。

要約(オリジナル)

In this paper, we propose a novel method for joint entity and relation extraction from unstructured text by framing it as a conditional sequence generation problem. In contrast to conventional generative information extraction models that are left-to-right token-level generators, our approach is \textit{span-based}. It generates a linearized graph where nodes represent text spans and edges represent relation triplets. Our method employs a transformer encoder-decoder architecture with pointing mechanism on a dynamic vocabulary of spans and relation types. Our model can capture the structural characteristics and boundaries of entities and relations through span representations while simultaneously grounding the generated output in the original text thanks to the pointing mechanism. Evaluation on benchmark datasets validates the effectiveness of our approach, demonstrating competitive results. Code is available at https://github.com/urchade/ATG.

arxiv情報

著者 Zaratiana Urchade,Nadi Tomeh,Pierre Holat,Thierry Charnois
発行日 2024-01-02 18:32:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク