Extending Explainable Ensemble Trees (E2Tree) to regression contexts


ランダム フォレストなどのアンサンブル手法は、教師あり学習の状況を一変させ、複数の弱学習器の集約を通じて高精度の予測を提供します。
ただし、その有効性にもかかわらず、これらの方法は透明性に欠けていることが多く、RF モデルがどのように予測に到達するのかについてのユーザーの理解を妨げます。
Explainable ensembletree (E2Tree) は、ランダム フォレストを説明するための新しい方法論であり、応答変数と予測子の間の関係をグラフで表現します。
E2Tree の顕著な特徴は、応答に対する予測変数の影響を考慮するだけでなく、計算と非類似性尺度の使用を通じて予測変数間の関連性も考慮することです。
E2Tree 手法は当初、分類タスクでの使用を目的として提案されました。


Ensemble methods such as random forests have transformed the landscape of supervised learning, offering highly accurate prediction through the aggregation of multiple weak learners. However, despite their effectiveness, these methods often lack transparency, impeding users’ comprehension of how RF models arrive at their predictions. Explainable ensemble trees (E2Tree) is a novel methodology for explaining random forests, that provides a graphical representation of the relationship between response variables and predictors. A striking characteristic of E2Tree is that it not only accounts for the effects of predictor variables on the response but also accounts for associations between the predictor variables through the computation and use of dissimilarity measures. The E2Tree methodology was initially proposed for use in classification tasks. In this paper, we extend the methodology to encompass regression contexts. To demonstrate the explanatory power of the proposed algorithm, we illustrate its use on real-world datasets.


著者 Massimo Aria,Agostino Gnasso,Carmela Iorio,Marjolein Fokkema
発行日 2024-09-10 11:42:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.CO, stat.ML パーマリンク