Identifying Differential Patient Care Through Inverse Intent Inference

要約

敗血症は、感染に対する宿主反応の調節不全による末端臓器の機能不全によって定義される、生命を脅かす状態です。
敗血症患者のケアを統一し正常化するために敗血症患者のケアを統一するために敗血症治療ガイドラインを立ち上げ、発表し続けているが、救急科と集中治療室における患者の入院期間全体にわたってケアに格差が存在することが多くの研究で報告されている。

ここでは、行動クローニング、模倣学習、逆強化学習などの多くの強化学習手法を適用し、専門家のデモンストレーションを使用して敗血症患者サブグループの管理における最適なポリシーを学習します。
次に、そのモデルを目に見えない医療集団の別のサブセットに適用することで反事実に基づく最適な政策を推定し、それを実際の政策と比較することで治療の違いを特定します。
私たちのデータは、MIMIC-IV の敗血症コホートとマサチューセッツ州ジェネラル ブリガム医療システムの臨床データ ウェアハウスから取得しています。
この研究の最終的な目的は、学習された最適な政策関数を使用して、事実に反する治療政策を推定し、対象となる部分母集団間の逸脱を特定することです。
私たちは、このアプローチが治療における格差を特定するのに役立つこと、また国の敗血症治療ガイドラインの発行に応じた治療法の変化を特定することに役立つことを願っています。

要約(オリジナル)

Sepsis is a life-threatening condition defined by end-organ dysfunction due to a dysregulated host response to infection. Although the Surviving Sepsis Campaign has launched and has been releasing sepsis treatment guidelines to unify and normalize the care for sepsis patients, it has been reported in numerous studies that disparities in care exist across the trajectory of patient stay in the emergency department and intensive care unit. Here, we apply a number of reinforcement learning techniques including behavioral cloning, imitation learning, and inverse reinforcement learning, to learn the optimal policy in the management of septic patient subgroups using expert demonstrations. Then we estimate the counterfactual optimal policies by applying the model to another subset of unseen medical populations and identify the difference in cure by comparing it to the real policy. Our data comes from the sepsis cohort of MIMIC-IV and the clinical data warehouses of the Mass General Brigham healthcare system. The ultimate objective of this work is to use the optimal learned policy function to estimate the counterfactual treatment policy and identify deviations across sub-populations of interest. We hope this approach would help us identify any disparities in care and also changes in cure in response to the publication of national sepsis treatment guidelines.

arxiv情報

著者 Hyewon Jeong,Siddharth Nayak,Taylor Killian,Sanjat Kanjilal
発行日 2024-11-19 15:53:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク