要約
この論文では、初期入力ベクトルに含まれる情報を補完する変数 (回帰の場合) を自動的に作成する方法を提案します。
この方法は、回帰される変数の連続値が一連の間隔に離散化され、値のしきい値を定義するために使用される前処理ステップとして機能します。
次に、分類器は、回帰される値がこれらの各しきい値以下であるかどうかを予測するようにトレーニングされます。
分類器のさまざまな出力は、回帰問題の初期ベクトルを強化する変数の追加ベクトルの形式で連結されます。
したがって、実装されたシステムは汎用の前処理ツールと考えることができます。
提案されたエンリッチメント手法を 5 種類の回帰変数でテストし、33 の回帰データセットで評価しました。
私たちの実験結果は、このアプローチの興味深いことを裏付けています。
要約(オリジナル)
This paper proposes a method for the automatic creation of variables (in the case of regression) that complement the information contained in the initial input vector. The method works as a pre-processing step in which the continuous values of the variable to be regressed are discretized into a set of intervals which are then used to define value thresholds. Then classifiers are trained to predict whether the value to be regressed is less than or equal to each of these thresholds. The different outputs of the classifiers are then concatenated in the form of an additional vector of variables that enriches the initial vector of the regression problem. The implemented system can thus be considered as a generic pre-processing tool. We tested the proposed enrichment method with 5 types of regressors and evaluated it in 33 regression datasets. Our experimental results confirm the interest of the approach.
arxiv情報
著者 | Colin Troisemaine,Vincent Lemaire |
発行日 | 2024-03-11 15:44:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google