要約
ビッグ データの時代、特にジオロケーション センサーの普及により、複雑な空間依存構造を示す大規模なデータセットがますます利用可能になっています。
この文脈では、統計学習の標準的な確率論は直接適用されず、そのようなデータから学習された予測ルールの一般化能力の保証は確立するために残されています。
ここでは、統計学習の観点から単純なクリギング タスクを分析します。つまり、ノンパラメトリック有限サンプル予測分析を実行します。
$d\geq 1$ の値が 2 乗可積分確率場 $X=\{X_s\}_{s\in S}$、$S\subset \mathbb{R}^2$、不明
共分散構造、サイト $s_1,\;
\lドット\;
$S$ の s_d$ の場合、目標は、最小の 2 次リスクで、S$ の $s\ の他の場所で得られる未知の値を予測することです。
トレーニング空間データセットから派生した予測ルール: $X$ の単一の実現 $X’$、予測されるものとは独立、$n\geq 1$ の場所 $\sigma_1,\ で観察。
\lドット\;
$S$ の \sigma_n$。
この最小化問題とカーネル リッジ回帰との関連性にもかかわらず、トレーニング データ $X’_{\sigma_1},\;
\lドット\;
X’_{\sigma_n}$ が学習手順に関与しています。
この記事では、オーダー $O_{\mathbb{P}}(1/\sqrt{n})$ の非漸近的境界が、次の場合に真の最小化を模倣するプラグイン予測ルールの過剰リスクについて証明されています。
学習段階で規則的なグリッドを形成する位置で観察される等方性定常ガウス過程。
これらの理論的結果は、シミュレートされたデータと実際のデータセットに関するさまざまな数値実験によって示されています。
要約(オリジナル)
In the Big Data era, with the ubiquity of geolocation sensors in particular, massive datasets exhibiting a possibly complex spatial dependence structure are becoming increasingly available. In this context, the standard probabilistic theory of statistical learning does not apply directly and guarantees of the generalization capacity of predictive rules learned from such data are left to establish. We analyze here the simple Kriging task from a statistical learning perspective, i.e. by carrying out a nonparametric finite-sample predictive analysis. Given $d\geq 1$ values taken by a realization of a square integrable random field $X=\{X_s\}_{s\in S}$, $S\subset \mathbb{R}^2$, with unknown covariance structure, at sites $s_1,\; \ldots,\; s_d$ in $S$, the goal is to predict the unknown values it takes at any other location $s\in S$ with minimum quadratic risk. The prediction rule being derived from a training spatial dataset: a single realization $X’$ of $X$, independent from those to be predicted, observed at $n\geq 1$ locations $\sigma_1,\; \ldots,\; \sigma_n$ in $S$. Despite the connection of this minimization problem with kernel ridge regression, establishing the generalization capacity of empirical risk minimizers is far from straightforward, due to the non independent and identically distributed nature of the training data $X’_{\sigma_1},\; \ldots,\; X’_{\sigma_n}$ involved in the learning procedure. In this article, non-asymptotic bounds of order $O_{\mathbb{P}}(1/\sqrt{n})$ are proved for the excess risk of a plug-in predictive rule mimicking the true minimizer in the case of isotropic stationary Gaussian processes, observed at locations forming a regular grid in the learning stage. These theoretical results are illustrated by various numerical experiments, on simulated data and on real-world datasets.
arxiv情報
著者 | Emilia Siviero,Emilie Chautru,Stephan Clémençon |
発行日 | 2023-02-27 18:06:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google