A Retrieval-Based Approach to Medical Procedure Matching in Romanian

要約

医療提供者から保険会社が使用する標準化された用語への医療処置の名前を正確にマッピングすることは、重要でありながら複雑なタスクです。
命名規則の矛盾は、誤った手続きにつながり、民間の医療環境で行政上の非効率性と保険請求の問題を引き起こします。
多くの企業は依然として手動マッピングに人事を使用していますが、自動化の明確な機会があります。
このペーパーでは、ルーマニアのヘルスケアシステムにおける医療名の一致のための文の埋め込みを活用する検索ベースのアーキテクチャを提案します。
この課題は、既存の前提条件の言語モデルが医療テキストへのドメイン固有の適応を欠いているルーマニア語などの過小評価されている言語では非常に困難です。
このタスクに最も効果的なソリューションを特定するために、ルーマニア、多言語、および医療ドメイン固有の表現を含む複数の埋め込みモデルを評価します。
私たちの調査結果は、ルーマニア語などの低リソース言語の医療NLPのより広い分野に貢献しています。

要約(オリジナル)

Accurately mapping medical procedure names from healthcare providers to standardized terminology used by insurance companies is a crucial yet complex task. Inconsistencies in naming conventions lead to missclasified procedures, causing administrative inefficiencies and insurance claim problems in private healthcare settings. Many companies still use human resources for manual mapping, while there is a clear opportunity for automation. This paper proposes a retrieval-based architecture leveraging sentence embeddings for medical name matching in the Romanian healthcare system. This challenge is significantly more difficult in underrepresented languages such as Romanian, where existing pretrained language models lack domain-specific adaptation to medical text. We evaluate multiple embedding models, including Romanian, multilingual, and medical-domain-specific representations, to identify the most effective solution for this task. Our findings contribute to the broader field of medical NLP for low-resource languages such as Romanian.

arxiv情報

著者 Andrei Niculae,Adrian Cosma,Emilian Radoi
発行日 2025-03-26 13:54:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク