Causal Falsification of Digital Twins

要約

デジタルツインは多くのアプリケーションで大きな可能性を秘めていますが、安全性が重要な環境でデジタルツインを広く導入するには、その精度を評価するための厳密な手順が不可欠です。
因果推論の枠組み内でこのタスクを定式化することにより、データ生成プロセスに関して潜在的に希薄な仮定が立てられない限り、現実世界の観察データを使用して双子の正しさを証明する試みは不健全であることを示します。
これらの仮定を回避するために、代わりに双子が正しくないケースを見つけることを目的とした評価戦略を提案し、それを行うための汎用の統計手順を提示します。この手順は、さまざまなアプリケーションや双子モデルにわたって使用できます。
私たちのアプローチは、双子と対象となる現実世界のプロセスに関する最小限の仮定の下で、双子に関する信頼性が高く実用的な情報をもたらします。
私たちは、ICU 患者の MIMIC-III データセットを使用して評価する、Pulse Physiology Engine 内での敗血症モデリングを含む大規模なケーススタディを通じて、私たちの方法論の有効性を実証します。

要約(オリジナル)

Digital twins hold substantial promise in many applications, but rigorous procedures for assessing their accuracy are essential for their widespread deployment in safety-critical settings. By formulating this task within the framework of causal inference, we show that attempts to certify the correctness of a twin using real-world observational data are unsound unless potentially tenuous assumptions are made about the data-generating process. To avoid these assumptions, we propose an assessment strategy that instead aims to find cases where the twin is not correct, and present a general-purpose statistical procedure for doing so that may be used across a wide variety of applications and twin models. Our approach yields reliable and actionable information about the twin under minimal assumptions about the twin and the real-world process of interest. We demonstrate the effectiveness of our methodology via a large-scale case study involving sepsis modelling within the Pulse Physiology Engine, which we assess using the MIMIC-III dataset of ICU patients.

arxiv情報

著者 Rob Cornish,Muhammad Faaiz Taufiq,Arnaud Doucet,Chris Holmes
発行日 2023-06-20 16:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, stat.AP, stat.ME パーマリンク