要約
この論文では、名前付きエンティティ認識タスクを境界ノイズ除去拡散プロセスとして定式化し、ノイズの多いスパンから名前付きエンティティを生成する DiffusionNER を提案します。
トレーニング中、DiffusionNER は、固定順拡散プロセスによってゴールデン エンティティ境界に徐々にノイズを追加し、エンティティ境界を回復するために逆拡散プロセスを学習します。
推論では、DiffusionNER は最初に標準ガウス分布からいくつかのノイズのあるスパンをランダムにサンプリングし、次に学習された逆拡散プロセスでノイズを除去することによって名前付きエンティティを生成します。
提案された境界ノイズ除去拡散プロセスにより、エンティティの漸進的な改良と動的なサンプリングが可能になり、DiffusionNER に効率的かつ柔軟なエンティティ生成機能が与えられます。
複数のフラットおよびネストされた NER データセットでの実験により、DiffusionNER が以前の最先端モデルと同等またはそれ以上のパフォーマンスを達成することが実証されました。
要約(オリジナル)
In this paper, we propose DiffusionNER, which formulates the named entity recognition task as a boundary-denoising diffusion process and thus generates named entities from noisy spans. During training, DiffusionNER gradually adds noises to the golden entity boundaries by a fixed forward diffusion process and learns a reverse diffusion process to recover the entity boundaries. In inference, DiffusionNER first randomly samples some noisy spans from a standard Gaussian distribution and then generates the named entities by denoising them with the learned reverse diffusion process. The proposed boundary-denoising diffusion process allows progressive refinement and dynamic sampling of entities, empowering DiffusionNER with efficient and flexible entity generation capability. Experiments on multiple flat and nested NER datasets demonstrate that DiffusionNER achieves comparable or even better performance than previous state-of-the-art models.
arxiv情報
著者 | Yongliang Shen,Kaitao Song,Xu Tan,Dongsheng Li,Weiming Lu,Yueting Zhuang |
発行日 | 2023-05-22 17:56:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google