要約
引用フィールド学習では、引用文字列を著者、タイトル、会場などの関心のあるフィールドに分割します。
引用からそのようなフィールドを抽出することは、引用のインデックス作成や研究者プロフィール分析などにとって非常に重要です。学術ホームページや履歴書などのユーザー作成のリソースは、豊富な引用フィールド情報を提供します。
ただし、一貫性のない引用スタイル、不完全な文構文、不十分なトレーニング データにより、これらのリソースからフィールドを抽出することは困難です。
これらの課題に対処するために、引用フィールド学習のパフォーマンスを向上させる新しいアルゴリズム CIFAL (アンカー学習による引用フィールド学習) を提案します。
CIFAL は、事前トレーニング済み言語モデルに対してモデルに依存しないアンカー学習を利用して、さまざまな引用スタイルのデータから引用パターンを捕捉します。
実験では、CIFAL が引用フィールド学習において最先端の手法を上回り、フィールドレベルの F1 スコアで 2.68% の向上を達成したことが実証されました。
結果の広範な分析により、CIFAL の有効性が定量的および定性的にさらに確認されました。
要約(オリジナル)
Citation field learning is to segment a citation string into fields of interest such as author, title, and venue. Extracting such fields from citations is crucial for citation indexing, researcher profile analysis, etc. User-generated resources like academic homepages and Curriculum Vitae, provide rich citation field information. However, extracting fields from these resources is challenging due to inconsistent citation styles, incomplete sentence syntax, and insufficient training data. To address these challenges, we propose a novel algorithm, CIFAL (citation field learning by anchor learning), to boost the citation field learning performance. CIFAL leverages the anchor learning, which is model-agnostic for any Pre-trained Language Model, to help capture citation patterns from the data of different citation styles. The experiments demonstrate that CIFAL outperforms state-of-the-art methods in citation field learning, achieving a 2.68% improvement in field-level F1-scores. Extensive analysis of the results further confirms the effectiveness of CIFAL quantitatively and qualitatively.
arxiv情報
著者 | Zilin Yuan,Borun Chen,Yimeng Dai,Yinghui Li,Hai-Tao Zheng,Rui Zhang |
発行日 | 2023-12-14 12:58:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google