VisRuler: Visual Analytics for Extracting Decision Rules from Bagged and Boosted Decision Trees

要約

バギングとブースティングは、機械学習 (ML) でよく使用される 2 つのアンサンブル手法であり、多数の個別のデシジョン ツリーを生成します。
これらのメソッドの固有のアンサンブル特性により、通常、予測パフォーマンスにおいて単一デシジョン ツリーや他の ML モデルよりも優れたパフォーマンスを発揮します。
ただし、デシジョン ツリーごとに多数の意思決定パスが生成されるため、モデル全体の複雑さが増し、金融、社会的ケア、医療など、信頼性と説明可能な意思決定が必要な分野での使用が妨げられます。
したがって、ランダム フォレストや適応ブースティングなどのバギングおよびブースティング アルゴリズムの解釈可能性は、決定の数が増加するにつれて低下します。
この論文では、ユーザーが (さまざまなアンサンブル学習アルゴリズムに由来する) 堅牢で多様なモデルのセットを選択し、重要な特徴を選択することを含む徹底的な視覚検査ワークフローを通じて、そのような ML モデルから意思決定を抽出するのを支援することを目的とした視覚分析ツールを提案します。
グローバルな貢献に応じて、どの決定がグローバルな説明に(または特定のケースについてはローカルに)不可欠であるかを決定します。
結果は、いくつかのモデルのクラス合意と、ユーザーによってエクスポートされた調査された手動決定に基づいて最終決定されます。
私たちは、ユースケース、使用シナリオ、ユーザー調査を通じて、VisRuler の適用性と有効性を評価しました。
評価の結果、ほとんどのユーザーが当社のシステムを使用して意思決定ルールを視覚的に探索し、提案されたタスクを実行し、満足のいく方法で所定の質問に答えることができたことが明らかになりました。

要約(オリジナル)

Bagging and boosting are two popular ensemble methods in machine learning (ML) that produce many individual decision trees. Due to the inherent ensemble characteristic of these methods, they typically outperform single decision trees or other ML models in predictive performance. However, numerous decision paths are generated for each decision tree, increasing the overall complexity of the model and hindering its use in domains that require trustworthy and explainable decisions, such as finance, social care, and health care. Thus, the interpretability of bagging and boosting algorithms, such as random forest and adaptive boosting, reduces as the number of decisions rises. In this paper, we propose a visual analytics tool that aims to assist users in extracting decisions from such ML models via a thorough visual inspection workflow that includes selecting a set of robust and diverse models (originating from different ensemble learning algorithms), choosing important features according to their global contribution, and deciding which decisions are essential for global explanation (or locally, for specific cases). The outcome is a final decision based on the class agreement of several models and the explored manual decisions exported by users. We evaluated the applicability and effectiveness of VisRuler via a use case, a usage scenario, and a user study. The evaluation revealed that most users managed to successfully use our system to explore decision rules visually, performing the proposed tasks and answering the given questions in a satisfying way.

arxiv情報

著者 Angelos Chatzimparmpas,Rafael M. Martins,Andreas Kerren
発行日 2024-04-18 16:59:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.LG, stat.ML パーマリンク