Augmented Functional Random Forests: Classifier Construction and Unbiased Functional Principal Components Importance through Ad-Hoc Conditional Permutations

要約

この論文では、関数データ分析 (FDA) とツリーベースの手法を統合し、高次元データの課題に対処し、既存の関数分類器の分類パフォーマンスを強化する新しい教師付き分類戦略を紹介します。
具体的には、機能主成分の重要性を評価するための新しいツールを組み込んだ、機能分類ツリーと機能ランダム フォレストの拡張バージョンを提案します。
このツールは、特に連続する微分から導出された相関特徴を扱う場合に、関数データにおける不偏順列特徴の重要性を決定するためのアドホックな方法を提供します。
私たちの研究は、これらの追加機能が関数分類器の予測能力を大幅に強化できることを示しています。
現実世界とシミュレートされたデータセットの両方に対する実験評価により、提案された方法論の有効性が実証され、既存の方法と比較して有望な結果が得られます。

要約(オリジナル)

This paper introduces a novel supervised classification strategy that integrates functional data analysis (FDA) with tree-based methods, addressing the challenges of high-dimensional data and enhancing the classification performance of existing functional classifiers. Specifically, we propose augmented versions of functional classification trees and functional random forests, incorporating a new tool for assessing the importance of functional principal components. This tool provides an ad-hoc method for determining unbiased permutation feature importance in functional data, particularly when dealing with correlated features derived from successive derivatives. Our study demonstrates that these additional features can significantly enhance the predictive power of functional classifiers. Experimental evaluations on both real-world and simulated datasets showcase the effectiveness of the proposed methodology, yielding promising results compared to existing methods.

arxiv情報

著者 Fabrizio Maturo,Annamaria Porreca
発行日 2024-08-23 15:58:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62G05, 62H30, 62J99, 68T05, 68T20, cs.LG, G.3, math.ST, stat.ME, stat.ML, stat.TH パーマリンク