Investigating a domain adaptation approach for integrating different measurement instruments in a longitudinal clinical registry

要約

縦断的な臨床登録では、異なる時点の個人を評価するために、異なる測定尺度が使用されている可能性がある。それらを組み合わせるために、我々は、異なる測定機器の項目がマッピングされた、ジョイント潜在表現を得るためのディープラーニング技術を研究している。これは、画像データに対するコンピュータサイエンスで確立された概念であるドメイン適応に相当する。提案するアプローチを例として、脊髄性筋萎縮症(SMA)患者のレジストリにおける、異なる運動機能測定機器を用いたアプリケーションを動機として、時点数がやや少ない縦断的コホート設定におけるドメイン適応の可能性を評価する。そこでは、常微分方程式(ODE)により潜在表現における軌跡をモデル化し、人固有のODEパラメータはベースライン特性から推測される。ODE解の適合度と複雑さによって、測定器のマッピングを判断することができる。続いて、モデルフィッティングに対応するペナルティ項を組み込むことで、どのようにアライメントを改善できるかを検討する。測定器間の違いの影響を系統的に調べるため、修正SMAデータに基づき、マッピングが原理的に実現可能であるはずのシナリオや、完全なマッピングが利用できないシナリオなど、いくつかのシナリオを検討する。より複雑なシナリオではミスアライメントが増加するが、測定器の利用可能性が患者の状態に依存する場合でも、ある程度の構造は回復する。妥当なマッピングは、より複雑な実際のSMAデータセットでも実行可能である。これらの結果は、縦断的登録データの統計的モデリングにおいて、領域適応がより一般的に有用である可能性を示している。

要約(オリジナル)

In a longitudinal clinical registry, different measurement instruments might have been used for assessing individuals at different time points. To combine them, we investigate deep learning techniques for obtaining a joint latent representation, to which the items of different measurement instruments are mapped. This corresponds to domain adaptation, an established concept in computer science for image data. Using the proposed approach as an example, we evaluate the potential of domain adaptation in a longitudinal cohort setting with a rather small number of time points, motivated by an application with different motor function measurement instruments in a registry of spinal muscular atrophy (SMA) patients. There, we model trajectories in the latent representation by ordinary differential equations (ODEs), where person-specific ODE parameters are inferred from baseline characteristics. The goodness of fit and complexity of the ODE solutions then allows to judge the measurement instrument mappings. We subsequently explore how alignment can be improved by incorporating corresponding penalty terms into model fitting. To systematically investigate the effect of differences between measurement instruments, we consider several scenarios based on modified SMA data, including scenarios where a mapping should be feasible in principle and scenarios where no perfect mapping is available. While misalignment increases in more complex scenarios, some structure is still recovered, even if the availability of measurement instruments depends on patient state. A reasonable mapping is feasible also in the more complex real SMA dataset. These results indicate that domain adaptation might be more generally useful in statistical modeling for longitudinal registry data.

arxiv情報

著者 Maren Hackenberg,Michelle Pfaffenlehner,Max Behrens,Astrid Pechmann,Janbernd Kirschner,Harald Binder
発行日 2023-12-01 14:28:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク