要約
タイトル:高次元空間におけるスーパー統計的特徴の分類
要約:
– 本研究では、一般的な凸損失関数と凸正則化の下で、一般的な重心を持つ2つのデータ点のクラウドの混合物の学習を、高次元領域で考察する。
– 各データ点のクラウドは、可能な可算でないガウス分布のスーパポジションからサンプリングされる。その分散は、一般的な確率密度関数$\varrho$を持つ。
– 本研究では、共分散がなく、冪律分布を持つ場合を含め、多くのデータ分布の家族を扱う。
– 獲得した推定器の汎化性能を研究し、正則化の役割、分布のスケールパラメータによる分離遷移の依存性を分析する。
要約(オリジナル)
We characterise the learning of a mixture of two clouds of data points with generic centroids via empirical risk minimisation in the high dimensional regime, under the assumptions of generic convex loss and convex regularisation. Each cloud of data points is obtained by sampling from a possibly uncountable superposition of Gaussian distributions, whose variance has a generic probability density $\varrho$. Our analysis covers therefore a large family of data distributions, including the case of power-law-tailed distributions with no covariance. We study the generalisation performance of the obtained estimator, we analyse the role of regularisation, and the dependence of the separability transition on the distribution scale parameters.
arxiv情報
著者 | Urte Adomaityte,Gabriele Sicuro,Pierpaolo Vivo |
発行日 | 2023-04-06 07:53:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI