Automatic Differential Diagnosis using Transformer-Based Multi-Label Sequence Classification

要約

人工知能の分野が進歩するにつれて、支援技術はあらゆる業界でより広く使用されるようになってきています。
医療業界も同様で、医療専門家向けの支援ツールを開発するために数多くの研究が行われています。
自動診断システムは、患者情報の収集、検査結果の分析、患者の診断など、さまざまなタスクを支援できる有益なツールの 1 つです。
しかし、鑑別診断を提供できるシステムを開発するという考えは、これらの研究研究のほとんどでほとんど無視されてきました。
この研究では、患者の年齢、性別、病歴​​、症状に基づいて鑑別診断を行うための変圧器ベースのアプローチを提案します。
当社では、49 種類の疾患に基づいて患者に鑑別診断情報を提供する DDXPlus データセットを使用しています。
まず、データセットから表形式の患者データを処理し、研究に適した患者レポートに加工する方法を提案します。
さらに、トレーニング データを多様化し、その結果モデルの堅牢性を向上させるために 2 つのデータ変更モジュールを導入します。
私たちはこのタスクにマルチラベル分類問題としてアプローチし、4 つの変圧器モデルを使用して広範な実験を実施しました。
すべてのモデルは、実施されたテストセットで 97% 以上の F1 スコアを達成することで、有望な結果を示しました。
さらに、モデルをより深く理解するために追加の動作テストを設計します。
特に、あるテスト ケースでは、医師の協力を得て 100 サンプルのカスタム テスト セットを準備しました。
カスタム セットの結果は、私たちが提案したデータ変更モジュールがモデルの一般化機能を改善したことを示しました。
私たちの発見が将来の研究者に貴重な洞察を提供し、自動鑑別診断のための信頼できるシステムを開発するきっかけとなることを願っています。

要約(オリジナル)

As the field of artificial intelligence progresses, assistive technologies are becoming more widely used across all industries. The healthcare industry is no different, with numerous studies being done to develop assistive tools for healthcare professionals. Automatic diagnostic systems are one such beneficial tool that can assist with a variety of tasks, including collecting patient information, analyzing test results, and diagnosing patients. However, the idea of developing systems that can provide a differential diagnosis has been largely overlooked in most of these research studies. In this study, we propose a transformer-based approach for providing differential diagnoses based on a patient’s age, sex, medical history, and symptoms. We use the DDXPlus dataset, which provides differential diagnosis information for patients based on 49 disease types. Firstly, we propose a method to process the tabular patient data from the dataset and engineer them into patient reports to make them suitable for our research. In addition, we introduce two data modification modules to diversify the training data and consequently improve the robustness of the models. We approach the task as a multi-label classification problem and conduct extensive experiments using four transformer models. All the models displayed promising results by achieving over 97% F1 score on the held-out test set. Moreover, we design additional behavioral tests to get a broader understanding of the models. In particular, for one of our test cases, we prepared a custom test set of 100 samples with the assistance of a doctor. The results on the custom set showed that our proposed data modification modules improved the model’s generalization capabilities. We hope our findings will provide future researchers with valuable insights and inspire them to develop reliable systems for automatic differential diagnosis.

arxiv情報

著者 Abu Adnan Sadi,Mohammad Ashrafuzzaman Khan,Lubaba Binte Saber
発行日 2024-08-28 14:40:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク