要約
誤った境界区分、複雑な意味表現、および発音と意味の違いは、しばしば中国の名前付きエンティティ認識(CNER)のエラーにつながります。
これらの問題に対処するために、このホワイトペーパーでは、HREB-CRFフレームワーク:CRFを使用した階層的な減少Bias EMAを提案しています。
提案された方法は、ローカルおよびグローバルな階層的注意の指数関数的に固定された加重平均を通じて、単語の境界とプールの長いテキスト勾配を増幅します。
MSRA、Resume、およびWeiboデータセットの実験結果は、F1で優れており、ベースラインモデルを1.1 \%、1.6 \%、および9.8 \%よりも優れています。
F1の大幅な改善は、CNERタスクにおける強い有効性と堅牢性の証拠を示しています。
要約(オリジナル)
Incorrect boundary division, complex semantic representation, and differences in pronunciation and meaning often lead to errors in Chinese Named Entity Recognition(CNER). To address these issues, this paper proposes HREB-CRF framework: Hierarchical Reduced-bias EMA with CRF. The proposed method amplifies word boundaries and pools long text gradients through exponentially fixed-bias weighted average of local and global hierarchical attention. Experimental results on the MSRA, Resume, and Weibo datasets show excellent in F1, outperforming the baseline model by 1.1\%, 1.6\%, and 9.8\%. The significant improvement in F1 shows evidences of strong effectiveness and robustness of approach in CNER tasks.
arxiv情報
著者 | Sijin Sun,Ming Deng,Xinrui Yu,Liangbin Zhao |
発行日 | 2025-05-12 09:24:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google