Online Data Collection for Efficient Semiparametric Inference

要約

多くの研究で統計データの融合が研究されていますが、通常はさまざまなデータセットが事前に与えられていることを前提としています。
ただし、実際には、推定には、利用可能なデータ ソース、そのコスト、各ソースから収集するサンプルの数を決定するなど、データ収集に関する難しい決定が必要になります。
さらに、特定の時点で収集されたデータによって将来の収集の決定が改善される可能性があるため、このプロセスは多くの場合連続的です。
私たちの設定では、複数のデータ ソースへのアクセスと予算の制約があるため、エージェントはターゲット パラメーターを効率的に推定するためにどのデータ ソースにクエリを実行するかを順番に決定する必要があります。
このタスクは、一連のモーメント条件によって識別されるパラメーターに適用されるセミパラメトリック フレームワークであるオンライン モーメント選択を使用して形式化します。
興味深いことに、最適な予算配分は (未知の) 真のパラメーターに依存します。
Explore-then-Commit と Explore-then-Greedy という 2 つのオンライン データ収集ポリシーを紹介します。これらは、特定の時点でのパラメーター推定を使用して、将来のステップで残りの予算を最適に割り当てるものです。
私たちは、両方のポリシーがオラクル ポリシーと比較して後悔ゼロ (漸近的 MSE によって評価) を達成することを証明します。
私たちは、合成および現実世界の因果効果推定タスクの両方で手法を経験的に検証し、オンライン データ収集ポリシーが固定のデータ収集ポリシーよりも優れていることを実証しました。

要約(オリジナル)

While many works have studied statistical data fusion, they typically assume that the various datasets are given in advance. However, in practice, estimation requires difficult data collection decisions like determining the available data sources, their costs, and how many samples to collect from each source. Moreover, this process is often sequential because the data collected at a given time can improve collection decisions in the future. In our setup, given access to multiple data sources and budget constraints, the agent must sequentially decide which data source to query to efficiently estimate a target parameter. We formalize this task using Online Moment Selection, a semiparametric framework that applies to any parameter identified by a set of moment conditions. Interestingly, the optimal budget allocation depends on the (unknown) true parameters. We present two online data collection policies, Explore-then-Commit and Explore-then-Greedy, that use the parameter estimates at a given time to optimally allocate the remaining budget in the future steps. We prove that both policies achieve zero regret (assessed by asymptotic MSE) relative to an oracle policy. We empirically validate our methods on both synthetic and real-world causal effect estimation tasks, demonstrating that the online data collection policies outperform their fixed counterparts.

arxiv情報

著者 Shantanu Gupta,Zachary C. Lipton,David Childers
発行日 2024-11-05 15:40:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク