要約
埋め込みモデルのドメイン特異性は、効果的なパフォーマンスに重要です。
ただし、Finmtebなどの既存のベンチマークは、主に高リソース言語向けに設計されており、韓国語などの低リソース設定が不足していることを残しています。
確立された英語のベンチマークを直接翻訳すると、低リソースのドメインに存在する言語的および文化的ニュアンスをキャプチャできないことがよくあります。
この論文では、2回のタイトル:低リソースのドメイン固有の埋め込みモデルがもたらす利点は何ですか?
韓国の金融テキストに関する事例研究では、韓国の金融領域の新しいベンチマークであるKorfinmtebを紹介します。特に、低資源言語での独自の文化的特徴を反映するように調整されています。
私たちの実験結果は、ModelsがFinmtebの翻訳バージョンで堅牢に機能する一方で、Korfinmtebでのパフォーマンスは、特により深い意味的理解を必要とするタスクで、直接的な翻訳の限界を強調する微妙でありながら重大な矛盾を明らかにすることを明らかにしています。
この矛盾は、言語固有の特異性と文化的ニュアンスを組み込んだベンチマークの必要性を強調しています。
私たちの研究からの洞察は、低リソースの設定での埋め込みモデルの進捗をより正確に評価および促進できるドメイン固有の評価フレームワークの開発を提唱しています。
要約(オリジナル)
Domain specificity of embedding models is critical for effective performance. However, existing benchmarks, such as FinMTEB, are primarily designed for high-resource languages, leaving low-resource settings, such as Korean, under-explored. Directly translating established English benchmarks often fails to capture the linguistic and cultural nuances present in low-resource domains. In this paper, titled TWICE: What Advantages Can Low-Resource Domain-Specific Embedding Models Bring? A Case Study on Korea Financial Texts, we introduce KorFinMTEB, a novel benchmark for the Korean financial domain, specifically tailored to reflect its unique cultural characteristics in low-resource languages. Our experimental results reveal that while the models perform robustly on a translated version of FinMTEB, their performance on KorFinMTEB uncovers subtle yet critical discrepancies, especially in tasks requiring deeper semantic understanding, that underscore the limitations of direct translation. This discrepancy highlights the necessity of benchmarks that incorporate language-specific idiosyncrasies and cultural nuances. The insights from our study advocate for the development of domain-specific evaluation frameworks that can more accurately assess and drive the progress of embedding models in low-resource settings.
arxiv情報
著者 | Yewon Hwang,Sungbum Jung,Hanwool Lee,Sara Yu |
発行日 | 2025-04-01 12:39:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google