要約
空間統計と機械学習では、カーネル行列は、予測、分類、最尤推定において極めて重要な役割を果たします。
徹底的な調査により、サンプリング位置がかなり均一に分散されている場合、サンプルサイズが大きい場合、カーネル行列が悪条件になることがわかります。
この条件は、予測および推定の計算に使用される数値アルゴリズムに重大な課題をもたらし、予測とガウス尤度の近似が必要になります。
大規模な空間データを管理するための現在の方法論をレビューすると、一部の方法ではこの悪条件の問題に対処できていないことがわかります。
このような悪条件の結果、確率過程の低ランク近似が生じることがよくあります。
このペーパーでは、さまざまな最適性基準を紹介し、それぞれに対する解決策を提供します。
要約(オリジナル)
In spatial statistics and machine learning, the kernel matrix plays a pivotal role in prediction, classification, and maximum likelihood estimation. A thorough examination reveals that for large sample sizes, the kernel matrix becomes ill-conditioned, provided the sampling locations are fairly evenly distributed. This condition poses significant challenges to numerical algorithms used in prediction and estimation computations and necessitates an approximation to prediction and the Gaussian likelihood. A review of current methodologies for managing large spatial data indicates that some fail to address this ill-conditioning problem. Such ill-conditioning often results in low-rank approximations of the stochastic processes. This paper introduces various optimality criteria and provides solutions for each.
arxiv情報
著者 | Hao Zhang |
発行日 | 2023-11-06 15:46:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google