Entity Linking in the Job Market Domain

要約

自然言語処理では、エンティティ リンク (EL) はウィキペディアを中心としてきましたが、雇用市場の分野ではまだ開拓されていません。
スキルへの言及を明確にすることは、現在の労働市場の需要についての洞察を得るのに役立ちます。
この研究では、私たちはこの領域における EL を初めて調査し、特に職業スキルと ESCO 分類との関連をターゲットにしています (le Vrang et al., 2014)。
以前の取り組みでは、粗粒度の (完全な) センテンスが対応する ESCO スキルに関連付けられていました。
この作業では、スキルに関するより詳細なスパンレベルの言及をリンクします。
合成的に生成されたメンション – スキル ペア データセット上で、2 つの高性能ニューラル EL モデル、バイエンコーダー (Wu et al., 2020) と自己回帰モデル (Cao et al., 2021) を調整し、それらを評価します。
人間による注釈付きのスキルリンクベンチマーク。
私たちの調査結果では、両方のモデルがスキルの暗黙的な言及を正しい分類上の対応物にリンクできることが明らかになりました。
経験的に、厳密な評価では BLINK が GENRE よりも優れていますが、緩やかな評価 (精度@$k$) では GENRE の方が優れています。

要約(オリジナル)

In Natural Language Processing, entity linking (EL) has centered around Wikipedia, but yet remains underexplored for the job market domain. Disambiguating skill mentions can help us get insight into the current labor market demands. In this work, we are the first to explore EL in this domain, specifically targeting the linkage of occupational skills to the ESCO taxonomy (le Vrang et al., 2014). Previous efforts linked coarse-grained (full) sentences to a corresponding ESCO skill. In this work, we link more fine-grained span-level mentions of skills. We tune two high-performing neural EL models, a bi-encoder (Wu et al., 2020) and an autoregressive model (Cao et al., 2021), on a synthetically generated mention–skill pair dataset and evaluate them on a human-annotated skill-linking benchmark. Our findings reveal that both models are capable of linking implicit mentions of skills to their correct taxonomy counterparts. Empirically, BLINK outperforms GENRE in strict evaluation, but GENRE performs better in loose evaluation (accuracy@$k$).

arxiv情報

著者 Mike Zhang,Rob van der Goot,Barbara Plank
発行日 2024-01-31 16:34:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク