Mitigating Language Bias in Cross-Lingual Job Retrieval: A Recruitment Platform Perspective

要約

履歴書と雇用投稿のテキストコンポーネントを理解することは、仕事に一致する精度を向上させ、オンライン採用プラットフォームで就職活動システムを最適化するために重要です。
ただし、既存の作業は主にこの情報内の個々のコンポーネントの分析に焦点を当てており、各側面を分析するために複数の専門的なツールを必要とします。
このようなばらばらの方法は、採用関連のテキスト処理における全体的な一般化可能性を潜在的に妨げる可能性があります。
したがって、複数のコンポーネントを統合文エンコーダに共同で学習するために、マルチタスクデュアルエンコーダーフレームワークを使用する統一文エンコーダーを提案します。
結果は、モデルサイズが小さいにもかかわらず、私たちの方法が他の最先端モデルよりも優れていることを示しています。
さらに、エンコーダーの言語バイアスを評価するために、新しいメトリックの言語バイアスKullback-Leibler Divergence(LBKL)を提案し、大幅なバイアスの削減と優れた言語的パフォーマンスを示します。

要約(オリジナル)

Understanding the textual components of resumes and job postings is critical for improving job-matching accuracy and optimizing job search systems in online recruitment platforms. However, existing works primarily focus on analyzing individual components within this information, requiring multiple specialized tools to analyze each aspect. Such disjointed methods could potentially hinder overall generalizability in recruitment-related text processing. Therefore, we propose a unified sentence encoder that utilized multi-task dual-encoder framework for jointly learning multiple component into the unified sentence encoder. The results show that our method outperforms other state-of-the-art models, despite its smaller model size. Moreover, we propose a novel metric, Language Bias Kullback-Leibler Divergence (LBKL), to evaluate language bias in the encoder, demonstrating significant bias reduction and superior cross-lingual performance.

arxiv情報

著者 Napat Laosaengpha,Thanit Tativannarat,Attapol Rutherford,Ekapol Chuangsuwanich
発行日 2025-02-05 14:38:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク