Identification and Estimation for Nonignorable Missing Data: A Data Fusion Approach

要約

データがランダムではなく欠落している設定 (MNAR) で、対象のパラメーターを特定して推定するタスクを検討します。
一般に、そのようなパラメータは、欠落しているデータ モデルに対する強い仮定がなければ特定されません。
この論文では、別のアプローチを採用し、MNAR データセット内の情報がランダム欠損 (MAR) の対象となる補助データセット内の情報によって強化される、データ フュージョンにヒントを得た方法を紹介します。
いずれかのデータセットのみを与えられた場合に対象のパラメーターを特定できない場合でも、2 つの相補的な仮定セットの下で、プールされたデータが与えられた場合には特定できることを示します。
特定されたパラメータに対して逆確率重み付け (IPW) 推定器を導出し、シミュレーション研究とデータ アプリケーションを通じて推定戦略のパフォーマンスを評価します。

要約(オリジナル)

We consider the task of identifying and estimating a parameter of interest in settings where data is missing not at random (MNAR). In general, such parameters are not identified without strong assumptions on the missing data model. In this paper, we take an alternative approach and introduce a method inspired by data fusion, where information in an MNAR dataset is augmented by information in an auxiliary dataset subject to missingness at random (MAR). We show that even if the parameter of interest cannot be identified given either dataset alone, it can be identified given pooled data, under two complementary sets of assumptions. We derive an inverse probability weighted (IPW) estimator for identified parameters, and evaluate the performance of our estimation strategies via simulation studies, and a data application.

arxiv情報

著者 Zixiao Wang,AmirEmad Ghassami,Ilya Shpitser
発行日 2024-02-28 18:36:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, stat.ME パーマリンク