要約
平均の中央値(MOM)は、尾のあるデータのコンテキストで人気を獲得した平均推定器です。
この作業では、データ分布が$ p \ in(1,2] $の最初の$ p $モーメントのみを所有している場合、クラス$ \ mathcal {f} $の各関数の平均を同時に推定するタスクでのパフォーマンスを分析します。
一般的な損失による入力と線形回帰、既存の作業の改善。
要約(オリジナル)
The Median of Means (MoM) is a mean estimator that has gained popularity in the context of heavy-tailed data. In this work, we analyze its performance in the task of simultaneously estimating the mean of each function in a class $\mathcal{F}$ when the data distribution possesses only the first $p$ moments for $p \in (1,2]$. We prove a new sample complexity bound using a novel symmetrization technique that may be of independent interest. Additionally, we present applications of our result to $k$-means clustering with unbounded inputs and linear regression with general losses, improving upon existing works.
arxiv情報
著者 | Mikael Møller Høgsgaard,Andrea Paudice |
発行日 | 2025-06-17 16:07:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google