Auxiliary Knowledge-Induced Learning for Automatic Multi-Label Medical Document Classification

要約

国際疾病分類 (ICD) は、臨床および管理を目的とした、さまざまな病気や症状に関する権威ある医学分類システムです。
ICD インデックス作成により、ICD コードのサブセットが医療記録に割り当てられます。
人間によるコーディングは労働集約的でエラーが発生しやすいため、多くの研究ではコーディング プロセスを自動化するために機械学習が採用されています。
ICD コーディングは、階層的に構成された非常に大規模なコレクションから各医療文書に複数のコードを割り当てる必要があるため、困難な作業です。
この論文では、3 つのアイデアを採用した ICD 索引付けの新しいアプローチを提案します。(1) マルチレベルの深拡張残差畳み込みエンコーダを使用して、臨床ノートからの情報を集約し、さまざまな長さのテキストにわたる文書表現を学習します。
(2) 医療記録の補助的な知識を使用して ICD 分類のタスクを形式化します。これには、臨床テキストだけでなく、ICD コードをより適切に推測するためのさまざまな臨床コードの用語や薬の処方も組み込まれています。
(3) ラベル表現の品質を向上させることを目的として、ICD コード間の共起パターンを活用するグラフ畳み込みネットワークを導入します。
実験結果は、提案された方法が多くの尺度で最先端のパフォーマンスを達成することを示しています。

要約(オリジナル)

The International Classification of Diseases (ICD) is an authoritative medical classification system of different diseases and conditions for clinical and management purposes. ICD indexing assigns a subset of ICD codes to a medical record. Since human coding is labour-intensive and error-prone, many studies employ machine learning to automate the coding process. ICD coding is a challenging task, as it needs to assign multiple codes to each medical document from an extremely large hierarchically organized collection. In this paper, we propose a novel approach for ICD indexing that adopts three ideas: (1) we use a multi-level deep dilated residual convolution encoder to aggregate the information from the clinical notes and learn document representations across different lengths of the texts; (2) we formalize the task of ICD classification with auxiliary knowledge of the medical records, which incorporates not only the clinical texts but also different clinical code terminologies and drug prescriptions for better inferring the ICD codes; and (3) we introduce a graph convolutional network to leverage the co-occurrence patterns among ICD codes, aiming to enhance the quality of label representations. Experimental results show the proposed method achieves state-of-the-art performance on a number of measures.

arxiv情報

著者 Xindi Wang,Robert E. Mercer,Frank Rudzicz
発行日 2024-05-29 13:44:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク