An Interpretable Rule Creation Method for Black-Box Models based on Surrogate Trees — SRules

要約

人工知能 (AI) システムが重要な意思決定プロセスにますます統合されるにつれ、透明性があり解釈可能なモデルの必要性が最も重要になってきています。
この記事では、ブラックボックス機械学習モデルの解釈可能性を向上させるために設計された、サロゲート デシジョン ツリー (SRules) に基づく新しいルールセット作成方法を紹介します。
SRules は、複雑なモデルの決定境界を近似する代理の解釈可能なデシジョン ツリー モデルを再帰的に作成することにより、機械学習モデルの精度、カバレッジ、解釈可能性のバランスをとります。
私たちは、これらのサロゲート モデルから簡潔で意味のあるルールを生成し、関係者が AI システムの意思決定プロセスを理解し、信頼できるようにする体系的なフレームワークを提案します。
私たちのアプローチは、解釈可能なルールを提供するだけでなく、これらのルールの信頼性と適用範囲を定量化します。
提案されたモデルでは、パラメータを調整して、モデルの一部の部分のほぼ完璧な適合と高い解釈性を可能にすることで、精度と範囲による解釈性の欠如を補うことができます。
結果は、SRules が他の最先端技術を改良し、モデルの特定のサブパートに対して高度に解釈可能な特定のルールを作成する可能性を導入していることを示しています。

要約(オリジナル)

As artificial intelligence (AI) systems become increasingly integrated into critical decision-making processes, the need for transparent and interpretable models has become paramount. In this article we present a new ruleset creation method based on surrogate decision trees (SRules), designed to improve the interpretability of black-box machine learning models. SRules balances the accuracy, coverage, and interpretability of machine learning models by recursively creating surrogate interpretable decision tree models that approximate the decision boundaries of a complex model. We propose a systematic framework for generating concise and meaningful rules from these surrogate models, allowing stakeholders to understand and trust the AI system’s decision-making process. Our approach not only provides interpretable rules, but also quantifies the confidence and coverage of these rules. The proposed model allows to adjust its parameters to counteract the lack of interpretability by precision and coverage by allowing a near perfect fit and high interpretability of some parts of the model . The results show that SRules improves on other state-of-the-art techniques and introduces the possibility of creating highly interpretable specific rules for specific sub-parts of the model.

arxiv情報

著者 Mario Parrón Verdasco,Esteban García-Cuesta
発行日 2024-07-29 14:56:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T01, cs.LG, I.2.6 パーマリンク