Safe Testing

要約

e 値に基づいて仮説検定の理論を開発します。これは、p 値とは異なり、新しい研究を実行するかどうかの決定が以前の結果に依存する可能性がある一般的なシナリオで、いくつかの研究からの結果を簡単に組み合わせることができる証拠の概念です。
結果。
e-値に基づくテストは安全です。つまり、そのようなオプションの継続の下で、タイプ I エラーの保証が保持されます。
成長率最適性 (GRO) をオプションの継続コンテキストにおける検出力の類似物として定義し、迷惑パラメーターを持つモデルを強調して、複合 null および代替を使用した一般的なテスト問題の GRO e 変数を構築する方法を示します。
GRO e 値は、特別な事前確率を持つベイズ因子の形式をとります。
1 サンプルの安全な t 検定や 2 x 2 分割表など、いくつかの古典的な例を使用して理論を説明します。
フィッシャー、ネイマニア、およびジェフリーズ・ベイズの解釈を共有することで、e-values は 3 つの学校すべての支持者に受け入れられる方法論を提供する可能性があります。

要約(オリジナル)

We develop the theory of hypothesis testing based on the e-value, a notion of evidence that, unlike the p-value, allows for effortlessly combining results from several studies in the common scenario where the decision to perform a new study may depend on previous outcomes. Tests based on e-values are safe, i.e. they preserve Type-I error guarantees, under such optional continuation. We define growth-rate optimality (GRO) as an analogue of power in an optional continuation context, and we show how to construct GRO e-variables for general testing problems with composite null and alternative, emphasizing models with nuisance parameters. GRO e-values take the form of Bayes factors with special priors. We illustrate the theory using several classic examples including a one-sample safe t-test and the 2 x 2 contingency table. Sharing Fisherian, Neymanian and Jeffreys-Bayesian interpretations, e-values may provide a methodology acceptable to adherents of all three schools.

arxiv情報

著者 Peter Grünwald,Rianne de Heide,Wouter Koolen
発行日 2023-03-07 15:17:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IT, cs.LG, math.IT, math.ST, stat.ME, stat.TH パーマリンク