SymmPI: Predictive Inference for Data with Group Symmetries

要約

予測の不確実性を定量化することは、現代の統計学における中心的な問題です。
予測推論の方法は、さまざまな仮定に基づいて開発されており、多くの場合、たとえば標準的な等角予測では、置換グループなどの特別な変換グループの下でのデータの分布の不変性に依存しています。
さらに、予測推論のための既存の手法の多くは、一連の特徴と結果の観察における未観察の結果を予測することを目的としています。
一方、より一般的な観察モデル(例:部分的に観察された特徴)や、より一般的な分布対称性を満たすデータ(例:物理学における回転不変または座標に依存しない観察)の下での予測推論に関心が集まっています。
ここでは、任意の観測モデルにおいてデータ分布が一般的なグループ対称性を持つ場合に予測推論を行うための方法論である SymmPI を提案します。
私たちの手法は、分布不変性を維持しながらデータを処理する分布等変変換という新しい概念を活用しています。
SymmPI が分布不変性の下で有効なカバレッジを持っていることを示し、分布シフトの下でのパフォーマンスを特徴付け、特別なケースとして最近の結果を復元します。
SymmPI を適用して、ネットワーク構造を変更しないように再ラベル付けしても分布が変更されない、ネットワーク内の頂点に関連付けられた未観測の値を予測します。
2 層階層モデルでのいくつかのシミュレーションと経験的データ分析の例では、SymmPI は既存の手法と比較して良好なパフォーマンスを示しました。

要約(オリジナル)

Quantifying the uncertainty of predictions is a core problem in modern statistics. Methods for predictive inference have been developed under a variety of assumptions, often — for instance, in standard conformal prediction — relying on the invariance of the distribution of the data under special groups of transformations such as permutation groups. Moreover, many existing methods for predictive inference aim to predict unobserved outcomes in sequences of feature-outcome observations. Meanwhile, there is interest in predictive inference under more general observation models (e.g., for partially observed features) and for data satisfying more general distributional symmetries (e.g., rotationally invariant or coordinate-independent observations in physics). Here we propose SymmPI, a methodology for predictive inference when data distributions have general group symmetries in arbitrary observation models. Our methods leverage the novel notion of distributional equivariant transformations, which process the data while preserving their distributional invariances. We show that SymmPI has valid coverage under distributional invariance and characterize its performance under distribution shift, recovering recent results as special cases. We apply SymmPI to predict unobserved values associated to vertices in a network, where the distribution is unchanged under relabelings that keep the network structure unchanged. In several simulations in a two-layer hierarchical model, and in an empirical data analysis example, SymmPI performs favorably compared to existing methods.

arxiv情報

著者 Edgar Dobriban,Mengxin Yu
発行日 2023-12-26 18:41:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.ME, stat.ML, stat.TH パーマリンク