Overparameterized Multiple Linear Regression as Hyper-Curve Fitting

要約

この論文は、固定効果多重線形回帰モデルを過剰パラメータ化されたデータセットに適用することは、単一のスカラー パラメータでパラメータ化されたハイパーカーブでデータをフィッティングすることと同等であることを示しています。
この等価性により、各予測子が選択されたパラメーターの関数によって記述される、予測子に焦点を当てたアプローチが可能になります。
線形モデルは、モデルの仮定に違反する非線形依存関係が存在する場合でも、正確な予測を生成することが証明されています。
ここでは、従属変数と予測関数空間の単項基底に関するパラメーター化が、合成データと実験データの両方に適用されます。
ハイパーカーブ アプローチは、予測子変数のノイズに関する問題の正則化に特に適しており、ノイズの多い「不適切な」予測子をモデルから削除するために使用できます。

要約(オリジナル)

The paper shows that the application of the fixed-effect multiple linear regression model to an overparameterized dataset is equivalent to fitting the data with a hyper-curve parameterized by a single scalar parameter. This equivalence allows for a predictor-focused approach, where each predictor is described by a function of the chosen parameter. It is proven that a linear model will produce exact predictions even in the presence of nonlinear dependencies that violate the model assumptions. Parameterization in terms of the dependent variable and the monomial basis in the predictor function space are applied here to both synthetic and experimental data. The hyper-curve approach is especially suited for the regularization of problems with noise in predictor variables and can be used to remove noisy and ‘improper’ predictors from the model.

arxiv情報

著者 E. Atza,N. Budko
発行日 2024-04-11 15:43:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク