Automatic ICD-10 Code Association: A Challenging Task on French Clinical Texts




– 電子医療データにICDコードを自動的に関連付けることは、医療研究におけるよく知られた自然言語処理(NLP)のタスクです。
– NLPは近年著しい進化を遂げており、Transformerアーキテクチャに基づいた事前学習済み言語モデルが主に英語言語で登場しています。
– この論文は、これらのモデルをICDコードを自動的に関連付けるために適応させます。
– 大量の入力トークンと推測するラベルを扱うことに対する課題に対処するために、複数のニューラルネットワークアーキテクチャが実験されました。
– 本論文では、最新のNLP進歩とICD-10コード関連付けの多レーベル分類を組み合わせたモデルを提案しています。
– フランス語での臨床データセットの公平な実験により、本アプローチは、最新の結果に比べて$F_1$-scoreメトリックを55%以上向上させました。


Automatically associating ICD codes with electronic health data is a well-known NLP task in medical research. NLP has evolved significantly in recent years with the emergence of pre-trained language models based on Transformers architecture, mainly in the English language. This paper adapts these models to automatically associate the ICD codes. Several neural network architectures have been experimented with to address the challenges of dealing with a large set of both input tokens and labels to be guessed. In this paper, we propose a model that combines the latest advances in NLP and multi-label classification for ICD-10 code association. Fair experiments on a Clinical dataset in the French language show that our approach increases the $F_1$-score metric by more than 55\% compared to state-of-the-art results.


著者 Yakini Tchouka,Jean-François Couchot,David Laiymani,Philippe Selles,Azzedine Rahmani
発行日 2023-04-06 06:31:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク