Meta-Analysis with Untrusted Data

要約

[完全な要約については論文を参照してください] メタ分析は、科学的な質問に答えるための重要なツールです。
通常、比較的少量の「信頼できる」データ、理想的には無作為化対照試験からのデータに対して実施され、最小限の仮定で因果関係を確実に推定できます。
2 つの変更を加えることで、因果関係の質問にさらに正確に答える方法を示します。
まず、厳密さを犠牲にしたり、強い仮定を導入したりすることなく、大規模な観察データベース、関連する科学文献、実際の経験から得られた信頼できないデータを組み込みます。
2 番目に、異種の試験を処理できるより豊富なモデルをトレーニングし、メタ分析における長年の課題に対処します。
私たちのアプローチは、基本的に厳密な予測区間を生成する等角予測に基づいていますが、間接的な観察は扱いません。メタ分析では、各試験の参加者の数が限られているため、ノイズの多い効果のみが観察されます。
ノイズを処理するために、特異性と呼ばれる新しい条件に基づいて、完全共形カーネル リッジ回帰のシンプルで効率的なバージョンを開発しました。
残差にノイズ補正項を導入し、「分散シェービング」手法を使用してそれらの相互作用を分析します。
医療データセットに対する複数の実験において、当社のアルゴリズムは従来のアルゴリズムよりも厳密で健全な間隔を提供します。
この論文は、より微妙で正確な予測のために異質性と信頼できないデータを受け入れる、メタ分析と証拠に基づく医療の新しい方向性を示しています。

要約(オリジナル)

[See paper for full abstract] Meta-analysis is a crucial tool for answering scientific questions. It is usually conducted on a relatively small amount of “trusted” data — ideally from randomized, controlled trials — which allow causal effects to be reliably estimated with minimal assumptions. We show how to answer causal questions much more precisely by making two changes. First, we incorporate untrusted data drawn from large observational databases, related scientific literature and practical experience — without sacrificing rigor or introducing strong assumptions. Second, we train richer models capable of handling heterogeneous trials, addressing a long-standing challenge in meta-analysis. Our approach is based on conformal prediction, which fundamentally produces rigorous prediction intervals, but doesn’t handle indirect observations: in meta-analysis, we observe only noisy effects due to the limited number of participants in each trial. To handle noise, we develop a simple, efficient version of fully-conformal kernel ridge regression, based on a novel condition called idiocentricity. We introduce noise-correcting terms in the residuals and analyze their interaction with a “variance shaving” technique. In multiple experiments on healthcare datasets, our algorithms deliver tighter, sounder intervals than traditional ones. This paper charts a new course for meta-analysis and evidence-based medicine, where heterogeneity and untrusted data are embraced for more nuanced and precise predictions.

arxiv情報

著者 Shiva Kaul,Geoffrey J. Gordon
発行日 2024-07-12 16:07:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク