Automated Model Selection for Generalized Linear Models

要約

このペーパーでは、混合整数円錐最適化を使用して、特徴サブセットの選択と全体的な一般化線形モデルを組み合わせて、モデル選択プロセスを完全に自動化する方法を示します。
具体的には、特徴選択タスクで多重共線性に対処するように設計された制約を課しながら、赤池情報基準とベイジアン情報基準を直接最適化します。
具体的には、符号コヒーレンス制約と、リッジ回帰や OSCAR モデルなどの古典的な統計モデルからのアイデアを組み合わせた、新しいペアワイズ相関制約を提案します。

要約(オリジナル)

In this paper, we show how mixed-integer conic optimization can be used to combine feature subset selection with holistic generalized linear models to fully automate the model selection process. Concretely, we directly optimize for the Akaike and Bayesian information criteria while imposing constraints designed to deal with multicollinearity in the feature selection task. Specifically, we propose a novel pairwise correlation constraint that combines the sign coherence constraint with ideas from classical statistical models like Ridge regression and the OSCAR model.

arxiv情報

著者 Benjamin Schwendinger,Florian Schwendinger,Laura Vana-Gür
発行日 2024-04-25 12:16:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T05, cs.LG, G.3, math.OC, stat.ML パーマリンク