Multi-stage Retrieve and Re-rank Model for Automatic Medical Coding Recommendation

要約

国際疾病分類 (ICD) は、幅広い疾患や症状を網羅する決定的な医学分類システムとして機能します。
ICD インデックスの主な目的は、ICD コードのサブセットを医療記録に割り当てることで、さまざまな健康状態の標準化された文書化と管理が容易になります。
既存のアプローチのほとんどは、ロングテールのラベル分布が多い非常に大規模な ICD コレクションから適切なラベルのサブセットを選択することに苦労していました。
この論文では、ハイブリッド離散検索手法を介した ICD インデックス付けの新しいソリューションとして、多段階の「検索と再ランク付け」フレームワークを活用し、モデルが
簡略化されたラベル空間からのより正確な予測。
検索モデルは、電子医療記録 (EHR) の補助知識と離散検索手法 (BM25) を組み合わせたもので、高品質の候補者を効率的に収集します。
最後の段階では、ラベルの共起に基づく対照的な再ランキング モデルを提案します。これは、陽性の ICD コードを持つ臨床ノートをまとめることによって候補ラベルを再ランク付けします。
実験結果は、提案された方法が MIMIC-III ベンチマークの多くの測定において最先端のパフォーマンスを達成することを示しています。

要約(オリジナル)

The International Classification of Diseases (ICD) serves as a definitive medical classification system encompassing a wide range of diseases and conditions. The primary objective of ICD indexing is to allocate a subset of ICD codes to a medical record, which facilitates standardized documentation and management of various health conditions. Most existing approaches have suffered from selecting the proper label subsets from an extremely large ICD collection with a heavy long-tailed label distribution. In this paper, we leverage a multi-stage “retrieve and re-rank” framework as a novel solution to ICD indexing, via a hybrid discrete retrieval method, and re-rank retrieved candidates with contrastive learning that allows the model to make more accurate predictions from a simplified label space. The retrieval model is a hybrid of auxiliary knowledge of the electronic health records (EHR) and a discrete retrieval method (BM25), which efficiently collects high-quality candidates. In the last stage, we propose a label co-occurrence guided contrastive re-ranking model, which re-ranks the candidate labels by pulling together the clinical notes with positive ICD codes. Experimental results show the proposed method achieves state-of-the-art performance on a number of measures on the MIMIC-III benchmark.

arxiv情報

著者 Xindi Wang,Robert E. Mercer,Frank Rudzicz
発行日 2024-05-29 13:54:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク