Composite Goodness-of-fit Tests with Kernels

要約

モデルの仕様の誤りは、確率モデルの実装に重大な課題を引き起こす可能性があるため、この問題を直接説明する一連の堅牢な手法の開発につながりました。
ただし、これらのより複雑な方法が必要かどうかは、モデルが本当に誤って指定されているかどうかによって決まり、この質問に答える一般的に適用可能な方法は不足しています。
本稿では、そのような手法の 1 つを提案します。
より正確には、私たちは、データが何らかのパラメトリック ファミリの分布に由来するかどうかに関心がある、困難な複合テスト問題に対してカーネル ベースの仮説テストを提案します。
私たちのテストでは、最大平均不一致とカーネル スタインの不一致に基づいた最小距離推定量を利用します。
これらは、パラメトリック モデルの密度が正規化定数まで既知である場合や、モデルがシミュレーターの形式をとる場合など、広く適用できます。
主な結果として、正しいテスト レベルを維持しながら、パラメーターを推定し、同じデータに対して (データ分割なしで) テストを実行できることを示します。
私たちのアプローチは、正規化されていないノンパラメトリック密度モデルの適合度のテストや、生物学的細胞ネットワークの扱いにくい生成モデルなど、さまざまな問題について説明されています。

要約(オリジナル)

Model misspecification can create significant challenges for the implementation of probabilistic models, and this has led to development of a range of robust methods which directly account for this issue. However, whether these more involved methods are required will depend on whether the model is really misspecified, and there is a lack of generally applicable methods to answer this question. In this paper, we propose one such method. More precisely, we propose kernel-based hypothesis tests for the challenging composite testing problem, where we are interested in whether the data comes from any distribution in some parametric family. Our tests make use of minimum distance estimators based on the maximum mean discrepancy and the kernel Stein discrepancy. They are widely applicable, including whenever the density of the parametric model is known up to normalisation constant, or if the model takes the form of a simulator. As our main result, we show that we are able to estimate the parameter and conduct our test on the same data (without data splitting), while maintaining a correct test level. Our approach is illustrated on a range of problems, including testing for goodness-of-fit of an unnormalised non-parametric density model, and an intractable generative model of a biological cellular network.

arxiv情報

著者 Oscar Key,Arthur Gretton,François-Xavier Briol,Tamara Fernandez
発行日 2023-05-29 16:27:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク