Free Discontinuity Regression: With an Application to the Economic Effects of Internet Shutdowns

要約

鋭く多次元の変化ポイント – 遺伝子発現プロファイリング、金融共分散の破損、気候変動検出、都市の社会経済マッピングなど、場所と大きさが不明である回帰面での急激なシフト。
それらの有病率にもかかわらず、統計的保証を使用して、ワンショットアプローチで設定された不連続性の位置とサイズを共同で推定する現在のアプローチはありません。
したがって、自由な不連続回帰(FDR)を導入します。これは、(i)回帰面を滑らかにする完全なノンパラメトリック推定器であり、(ii)連続領域に分割し、(iii)ジャンプの正確な位置とサイズを実証します。
Mumford-Shah機能の凸緩和をランダムな空間サンプリングと相関ノイズに拡張することにより、FDRは固定グリッドとI.I.Dを克服します。
古典的な画像セグメンテーションアプローチのノイズ仮定により、そのアプリケーションが任意の次元の実際のデータへのアプリケーションを可能にします。
これにより、多変量ジャンプ表面の最初の識別と均一な一貫性の結果が得られます。軽度のSBV規則性、推定関数、その不連続セット、およびすべてのジャンプサイズが真の母集団に収束します。
HyperParametersは、Steinの公平なリスク推定値を使用してデータから自動的に選択され、最大3次元の大規模なシミュレーションが理論的結果を検証し、有限サンプルのパフォーマンスを実証します。
インドのインターネットシャットダウンにFDRを適用すると、以前の推定値よりも大きい推定シャットダウン境界周辺で経済活動が25〜35%減少することが明らかになりました。
Smoothing、セグメンテーション、および一般的な統計的設定での効果サイズの回復を統合することにより、FDRは自由非紛争のアイデアを、最新の多変量データの正式な保証を備えた実用的なツールに変えます。

要約(オリジナル)

Sharp, multidimensional changepoints-abrupt shifts in a regression surface whose locations and magnitudes are unknown-arise in settings as varied as gene-expression profiling, financial covariance breaks, climate-regime detection, and urban socioeconomic mapping. Despite their prevalence, there are no current approaches that jointly estimate the location and size of the discontinuity set in a one-shot approach with statistical guarantees. We therefore introduce Free Discontinuity Regression (FDR), a fully nonparametric estimator that simultaneously (i) smooths a regression surface, (ii) segments it into contiguous regions, and (iii) provably recovers the precise locations and sizes of its jumps. By extending a convex relaxation of the Mumford-Shah functional to random spatial sampling and correlated noise, FDR overcomes the fixed-grid and i.i.d. noise assumptions of classical image-segmentation approaches, thus enabling its application to real-world data of any dimension. This yields the first identification and uniform consistency results for multivariate jump surfaces: under mild SBV regularity, the estimated function, its discontinuity set, and all jump sizes converge to their true population counterparts. Hyperparameters are selected automatically from the data using Stein’s Unbiased Risk Estimate, and large-scale simulations up to three dimensions validate the theoretical results and demonstrate good finite-sample performance. Applying FDR to an internet shutdown in India reveals a 25-35% reduction in economic activity around the estimated shutdown boundaries-much larger than previous estimates. By unifying smoothing, segmentation, and effect-size recovery in a general statistical setting, FDR turns free-discontinuity ideas into a practical tool with formal guarantees for modern multivariate data.

arxiv情報

著者 Florian Gunsilius,David Van Dijcke
発行日 2025-05-08 15:35:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, econ.EM, math.ST, stat.AP, stat.ME, stat.TH パーマリンク