ConFit: Improving Resume-Job Matching using Data Augmentation and Contrastive Learning

要約

信頼性の高い履歴書と求人のマッチング システムは、企業が履歴書のプールから適切な候補者を見つけるのに役立ち、求職者が求人情報のリストから関連する求人を見つけるのに役立ちます。
ただし、求職者は少数の求人にしか応募しないため、履歴書と求人のデータセット内のやり取りの記録はまばらです。
複雑なモデリング技術を使用する多くのこれまでの研究とは異なり、私たちはデータ拡張と単純な対照学習アプローチを使用してこのスパース性の問題に取り組みます。
ConFit はまず、履歴書または求人情報の特定のセクションを言い換えることによって、拡張された履歴書と求人のデータセットを作成します。
次に、ConFit は対照学習を使用して、トレーニング サンプルをバッチあたり $B$ ペアからバッチあたり $O(B^2)$ までさらに増やします。
2 つの現実世界のデータセットで ConFit を評価したところ、nDCG@10 ではジョブのランク付けと履歴書のランク付けにおいて、従来の方法 (BM25 および OpenAI text-ada-002 を含む) よりも絶対値​​でそれぞれ最大 19% と 31% 優れていることがわかりました。

要約(オリジナル)

A reliable resume-job matching system helps a company find suitable candidates from a pool of resumes, and helps a job seeker find relevant jobs from a list of job posts. However, since job seekers apply only to a few jobs, interaction records in resume-job datasets are sparse. Different from many prior work that use complex modeling techniques, we tackle this sparsity problem using data augmentations and a simple contrastive learning approach. ConFit first creates an augmented resume-job dataset by paraphrasing specific sections in a resume or a job post. Then, ConFit uses contrastive learning to further increase training samples from $B$ pairs per batch to $O(B^2)$ per batch. We evaluate ConFit on two real-world datasets and find it outperforms prior methods (including BM25 and OpenAI text-ada-002) by up to 19% and 31% absolute in nDCG@10 for ranking jobs and ranking resumes, respectively.

arxiv情報

著者 Xiao Yu,Jinzhong Zhang,Zhou Yu
発行日 2024-01-29 17:55:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY パーマリンク