Practical considerations for variable screening in the Super Learner

要約

予測関数の推定は、多くのデータ分析の基本的なコンポーネントです。
スタッキングの特定の実装であるスーパーラーナー アンサンブルは、望ましい理論的特性を備えており、多くのアプリケーションでうまく使用されています。
次元削減は、他の予測アルゴリズムを当てはめる前に、アンサンブル内でなげなわなどの変数スクリーニング アルゴリズムを使用することで実現できます。
ただし、なげなわのパフォーマンスが低いことが知られている場合、次元削減になげなわを使用したスーパー学習者のパフォーマンスは十分に調査されていません。
スーパーラーナー用の予測アルゴリズムのライブラリを選択するためのガイダンスと同様に、1 つのスクリーニングのパフォーマンス低下を防ぐために、候補スクリーニング アルゴリズムの多様なセットを使用する必要があることを示唆する経験的結果を提供します。

要約(オリジナル)

Estimating a prediction function is a fundamental component of many data analyses. The Super Learner ensemble, a particular implementation of stacking, has desirable theoretical properties and has been used successfully in many applications. Dimension reduction can be accomplished by using variable screening algorithms, including the lasso, within the ensemble prior to fitting other prediction algorithms. However, the performance of a Super Learner using the lasso for dimension reduction has not been fully explored in cases where the lasso is known to perform poorly. We provide empirical results that suggest that a diverse set of candidate screening algorithms should be used to protect against poor performance of any one screen, similar to the guidance for choosing a library of prediction algorithms for the Super Learner.

arxiv情報

著者 Brian D. Williamson,Drew King,Ying Huang
発行日 2023-11-06 18:04:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク