要約
この論文では、NLPCC 2015 におけるエンティティの認識とリンクの課題に対処するための新しいアプローチを紹介します。このタスクには、短い検索クエリから固有表現の言及を抽出し、それらを参照中国語知識ベース内のエンティティにリンクすることが含まれます。
この問題に対処するために、まず既存の知識ベースを拡張し、外部知識を活用して候補エンティティを特定し、それによって再現率を向上させます。
次に、候補エンティティから特徴を抽出し、結果をフィルターするためのスコアリング関数としてサポート ベクター回帰と重加算回帰ツリーを利用します。
さらに、ルールを適用して結果をさらに絞り込み、精度を高めます。
私たちの方法は計算効率が高く、F1 スコア 0.535 を達成します。
要約(オリジナル)
This paper presents a novel approach to address the Entity Recognition and Linking Challenge at NLPCC 2015. The task involves extracting named entity mentions from short search queries and linking them to entities within a reference Chinese knowledge base. To tackle this problem, we first expand the existing knowledge base and utilize external knowledge to identify candidate entities, thereby improving the recall rate. Next, we extract features from the candidate entities and utilize Support Vector Regression and Multiple Additive Regression Tree as scoring functions to filter the results. Additionally, we apply rules to further refine the results and enhance precision. Our method is computationally efficient and achieves an F1 score of 0.535.
arxiv情報
著者 | Di Lu,Zhongping Liang,Caixia Yuan,Xiaojie Wang |
発行日 | 2023-09-13 03:53:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google