Detecting critical treatment effect bias in small subgroups

要約

ランダム化試験は医学において情報に基づいた意思決定を行うためのゴールドスタンダードと考えられていますが、臨床現場では患者集団に対する一般化性に欠けていることがよくあります。
一方、観察研究はより広範な患者集団を対象としていますが、さまざまなバイアスがかかりやすいです。
したがって、観察研究を意思決定に使用する前に、その治療効果の推定値をランダム化試験から得られたものと比較してベンチマークすることが重要です。
私たちは、平均的な治療効果を超えた観察研究のベンチマークとなる新しい戦略を提案します。
まず、一連の関連する特徴を条件として、2 つの研究から推定される治療効果がある程度の許容誤差まで異なるという帰無仮説に対する統計検定を設計します。
次に、観察研究のサブグループの最大バイアス強度について漸近的に有効な下限を推定します。
最後に、現実世界の環境でベンチマーク戦略を検証し、それが確立された医学知識と一致する結論につながることを示します。

要約(オリジナル)

Randomized trials are considered the gold standard for making informed decisions in medicine, yet they often lack generalizability to the patient populations in clinical practice. Observational studies, on the other hand, cover a broader patient population but are prone to various biases. Thus, before using an observational study for decision-making, it is crucial to benchmark its treatment effect estimates against those derived from a randomized trial. We propose a novel strategy to benchmark observational studies beyond the average treatment effect. First, we design a statistical test for the null hypothesis that the treatment effects estimated from the two studies, conditioned on a set of relevant features, differ up to some tolerance. We then estimate an asymptotically valid lower bound on the maximum bias strength for any subgroup in the observational study. Finally, we validate our benchmarking strategy in a real-world setting and show that it leads to conclusions that align with established medical knowledge.

arxiv情報

著者 Piersilvio De Bartolomeis,Javier Abad,Konstantin Donhauser,Fanny Yang
発行日 2024-04-29 17:44:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク