CoAD: Automatic Diagnosis through Symptom and Disease Collaborative Generation

要約

ヘルスケアにおける AI の重要な応用である自動診断 (AD) は、機械学習技術を採用して、医師が正確な疾患診断のために患者の症状情報を収集できるように支援します。
Transformer ベースの方法では、入力された症状シーケンスを利用し、自己回帰を通じてそれ自体を予測し、最終的な症状の隠れた状態を利用して病気を判定します。
そのシンプルさと優れたパフォーマンスが実証されているにもかかわらず、1) トレーニング中と生成中に観察された症状間の不一致、2) 異なる症状の順序が病気の予測に及ぼす影響によって、病気の診断精度の低下が観察されています。
上記の障害に対処するために、我々は、新しい疾患と症状の協調生成フレームワークである CoAD を導入します。これには、AD を改善するためのいくつかの重要な革新が組み込まれています。 1) 文章レベルの疾患ラベルを、考えられる複数の症状調査ステップと調整して、トレーニングと症状の間のギャップを埋める。
世代;
2)症状のサブシーケンスごとに症状ラベルを拡張して、注釈を強化し、症状の順序の影響を排除する。
3) 拡張された疾患と症状のラベルを効果的かつ効率的に学習するための反復症状入力スキーマを開発します。
我々は、3 つの公的データセットと 1 つの民間データセットを含む 4 つのデータセットを使用して CoAD フレームワークを評価し、疾患の自動診断においてこれまでの最先端の結果と比較して平均 2.3% の改善を達成することを実証しました。
再現性を高めるために、コードとデータを https://github.com/KwanWaiChung/coad でリリースします。

要約(オリジナル)

Automatic diagnosis (AD), a critical application of AI in healthcare, employs machine learning techniques to assist doctors in gathering patient symptom information for precise disease diagnosis. The Transformer-based method utilizes an input symptom sequence, predicts itself through auto-regression, and employs the hidden state of the final symptom to determine the disease. Despite its simplicity and superior performance demonstrated, a decline in disease diagnosis accuracy is observed caused by 1) a mismatch between symptoms observed during training and generation, and 2) the effect of different symptom orders on disease prediction. To address the above obstacles, we introduce the CoAD, a novel disease and symptom collaborative generation framework, which incorporates several key innovations to improve AD: 1) aligning sentence-level disease labels with multiple possible symptom inquiry steps to bridge the gap between training and generation; 2) expanding symptom labels for each sub-sequence of symptoms to enhance annotation and eliminate the effect of symptom order; 3) developing a repeated symptom input schema to effectively and efficiently learn the expanded disease and symptom labels. We evaluate the CoAD framework using four datasets, including three public and one private, and demonstrate that it achieves an average 2.3% improvement over previous state-of-the-art results in automatic disease diagnosis. For reproducibility, we release the code and data at https://github.com/KwanWaiChung/coad.

arxiv情報

著者 Huimin Wang,Wai-Chung Kwan,Kam-Fai Wong,Yefeng Zheng
発行日 2023-07-17 07:24:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク