要約
症候群の早期診断のための機械学習は、数時間前に観察された臨床測定値を考慮して、ほとんどの場合、観察された臨床測定値 (原因) に適用される医学的コンセンサスの定義の結果 (効果) であるグラウンド トゥルース ラベルを予測するという複雑なタスクを解決することを目的としています。
将来の影響の予測に焦点を当てる代わりに、臨床変数の時系列予測 (TSF) によって原因を直接予測し、その予測値にゴールド スタンダードのコンセンサス定義を適用することによって影響を決定することを提案します。
この方法には、臨床従事者が直接解釈できるという貴重な利点があり、モデルのトレーニングが特定のラベルに依存しなくなったため、予測データを使用してコンセンサスに基づくラベルを予測できます。
我々は、SOFA に基づく敗血症-3 定義と新しい簡易急性生理学スコア (SAPS-II) 定義に含まれるまばらな臨床変数の正確な予測に焦点を当てて、Transformer モデルを使用した長期 TSF を使用して手法を例示します。
私たちの実験は 2 つのデータセットに対して行われ、時系列用の集合関数エンコーダーと直接マルチステップ デコーダーを提唱する最近の提案とは対照的に、標準的な高密度エンコーダーと反復マルチステップ デコーダーを組み合わせることによって最良の結果が得られることが示されました。
反復マルチステップ復号化の成功の鍵は、異変間の依存関係を捕捉する能力と、次のタイム ステップ予測のためにそれ自身の前のタイム ステップ予測に依存するようにモデルに教える学習者強制トレーニング戦略に起因すると考えられます。
要約(オリジナル)
Machine learning for early syndrome diagnosis aims to solve the intricate task of predicting a ground truth label that most often is the outcome (effect) of a medical consensus definition applied to observed clinical measurements (causes), given clinical measurements observed several hours before. Instead of focusing on the prediction of the future effect, we propose to directly predict the causes via time series forecasting (TSF) of clinical variables and determine the effect by applying the gold standard consensus definition to the forecasted values. This method has the invaluable advantage of being straightforwardly interpretable to clinical practitioners, and because model training does not rely on a particular label anymore, the forecasted data can be used to predict any consensus-based label. We exemplify our method by means of long-term TSF with Transformer models, with a focus on accurate prediction of sparse clinical variables involved in the SOFA-based Sepsis-3 definition and the new Simplified Acute Physiology Score (SAPS-II) definition. Our experiments are conducted on two datasets and show that contrary to recent proposals which advocate set function encoders for time series and direct multi-step decoders, best results are achieved by a combination of standard dense encoders with iterative multi-step decoders. The key for success of iterative multi-step decoding can be attributed to its ability to capture cross-variate dependencies and to a student forcing training strategy that teaches the model to rely on its own previous time step predictions for the next time step prediction.
arxiv情報
| 著者 | Michael Staniek,Marius Fracarolli,Michael Hagmann,Stefan Riezler |
| 発行日 | 2024-08-07 14:52:06+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google