A survey and taxonomy of methods interpreting random forest models

要約

ランダム フォレスト (RF) モデルの解釈可能性は、機械学習 (ML) コミュニティで関心が高まっている研究トピックです。
最先端技術では、RF は、その予測パフォーマンス、柔軟性、使いやすさを考慮すると、強力な学習アンサンブルであると考えられています。
さらに、RF モデルの内部プロセスは、RF デシジョン ツリー アンサンブルの構築に直感的でわかりやすいアプローチを使用しているため、理解できます。
ただし、RF の結果として得られるモデルは、多数の深い決定木があるため、「ブラック ボックス」とみなされます。
各ディシジョン ツリーを調査して、最終的な意思決定に至るプロセス全体の可視性を得るのは、不可能ではないにしても、複雑です。
この複雑さにより、いくつかの応用分野における RF モデルの受け入れと実装が制限されます。
いくつかの論文が RF モデルの解釈に取り組んできました。
このペーパーは、RF 結果のモデルを解釈するために文献で使用されている方法の広範なレビューを提供することを目的としています。
これらの手法を分析し、さまざまな軸に基づいて分類しました。
このレビューは網羅的なものではありませんが、求められる解釈可能性の側面に応じて、ユーザーが RF モデルを解釈するための最適なツールを選択する際のガイドとなるさまざまな手法の分類を提供します。
また、一般的に RF または ML ブラック ボックスの解釈可能性に研究を集中させたいと考えている研究者にとっても有益です。

要約(オリジナル)

The interpretability of random forest (RF) models is a research topic of growing interest in the machine learning (ML) community. In the state of the art, RF is considered a powerful learning ensemble given its predictive performance, flexibility, and ease of use. Furthermore, the inner process of the RF model is understandable because it uses an intuitive and intelligible approach for building the RF decision tree ensemble. However, the RF resulting model is regarded as a ‘black box’ because of its numerous deep decision trees. Gaining visibility over the entire process that induces the final decisions by exploring each decision tree is complicated, if not impossible. This complexity limits the acceptance and implementation of RF models in several fields of application. Several papers have tackled the interpretation of RF models. This paper aims to provide an extensive review of methods used in the literature to interpret RF resulting models. We have analyzed these methods and classified them based on different axes. Although this review is not exhaustive, it provides a taxonomy of various techniques that should guide users in choosing the most appropriate tools for interpreting RF models, depending on the interpretability aspects sought. It should also be valuable for researchers who aim to focus their work on the interpretability of RF or ML black boxes in general.

arxiv情報

著者 Maissae Haddouchi,Abdelaziz Berrado
発行日 2024-07-17 17:33:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T99, cs.LG パーマリンク