Sequential Kernelized Independence Testing

要約

独立性テストは、データを収集する前にサンプルサイズを修正するときにバッチ設定で広く研究されている古典的な統計的問題です。
ただし、実務家は、事前にサンプルサイズを設定する代わりに、手元の問題の複雑さに適応する手順を好むことがよくあります。
理想的には、そのような手順は、(a)簡単なタスク(そして後で難しいタスクで)で停止するため、利用可能なリソースをよりよく利用し、(b)誤ったアラームレートを制御しながら、データを継続的に監視し、新しいデータを収集した後に統計的証拠を効率的に組み込む必要があります。
古典的なバッチテストは、データのストリーミングに合わせて調整されていません。データの覗き見後の有効な推論では、低電力をもたらす複数のテストの修正が必要です。
賭けによるテストの原則に従って、そのような欠点を克服する順次核の独立性テストを設計します。
Kernelizedの依存測定に触発されたBETを使用して、幅広いフレームワークを例示しています。たとえば、Hilbert-Schmidt独立基準。
私たちのテストは、noni.i.d。、時変設定の下でも有効です。
シミュレートされたデータと実際のデータの両方でアプローチの力を示します。

要約(オリジナル)

Independence testing is a classical statistical problem that has been extensively studied in the batch setting when one fixes the sample size before collecting data. However, practitioners often prefer procedures that adapt to the complexity of a problem at hand instead of setting sample size in advance. Ideally, such procedures should (a) stop earlier on easy tasks (and later on harder tasks), hence making better use of available resources, and (b) continuously monitor the data and efficiently incorporate statistical evidence after collecting new data, while controlling the false alarm rate. Classical batch tests are not tailored for streaming data: valid inference after data peeking requires correcting for multiple testing which results in low power. Following the principle of testing by betting, we design sequential kernelized independence tests that overcome such shortcomings. We exemplify our broad framework using bets inspired by kernelized dependence measures, e.g., the Hilbert-Schmidt independence criterion. Our test is also valid under non-i.i.d., time-varying settings. We demonstrate the power of our approaches on both simulated and real data.

arxiv情報

著者 Aleksandr Podkopaev,Patrick Blöbaum,Shiva Prasad Kasiviswanathan,Aaditya Ramdas
発行日 2025-05-20 16:51:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ME, stat.ML, stat.TH パーマリンク