要約
機械学習モデルが特定の予測に到達する理由を説明する能力は、重要なシステムの人間のオペレーターによる意思決定支援として使用される場合、重要です。
提供された説明は、最小限の説明と呼ばれる冗長な情報がないことを証明できるほど正しく、できれば冗長な情報がなければなりません。
この論文では、最小限だけでなく、コスト関数に関しても最小限のツリーアンサンブルによって行われた予測の説明を見つけることを目指しています。
この目的のために、最初に説明の正確性を決定できる非常に効率的なオラクルを提示し、最小限の説明を計算する際に、現在の最先端の代替のランタイムパフォーマンスを数桁上回ります。
第二に、予測ごとに単一の最小説明を計算する目的で、関連作品(M-Marcoと呼ばれる)のMarcoと呼ばれるアルゴリズムを適応させ、すべての最小限の説明を列挙するMarcoアルゴリズムと比較して2の全体的な速度係数を実証します。
最後に、一連のユースケースから得られた説明を研究し、それらの特性のさらなる洞察につながります。
特に、いくつかのケースでは、単一の予測のために選択する最小限の説明が100,000を超える最小限の説明があることを観察します。
これらの場合、最小限の説明のごく一部のみが最小であり、最小限の説明は冗長性が大幅に少ないため、この作業の目的を動機付けていることがわかります。
要約(オリジナル)
The ability to explain why a machine learning model arrives at a particular prediction is crucial when used as decision support by human operators of critical systems. The provided explanations must be provably correct, and preferably without redundant information, called minimal explanations. In this paper, we aim at finding explanations for predictions made by tree ensembles that are not only minimal, but also minimum with respect to a cost function. To this end, we first present a highly efficient oracle that can determine the correctness of explanations, surpassing the runtime performance of current state-of-the-art alternatives by several orders of magnitude when computing minimal explanations. Secondly, we adapt an algorithm called MARCO from related works (calling it m-MARCO) for the purpose of computing a single minimum explanation per prediction, and demonstrate an overall speedup factor of two compared to the MARCO algorithm which enumerates all minimal explanations. Finally, we study the obtained explanations from a range of use cases, leading to further insights of their characteristics. In particular, we observe that in several cases, there are more than 100,000 minimal explanations to choose from for a single prediction. In these cases, we see that only a small portion of the minimal explanations are also minimum, and that the minimum explanations are significantly less verbose, hence motivating the aim of this work.
arxiv情報
著者 | John Törnblom,Emil Karlsson,Simin Nadjm-Tehrani |
発行日 | 2025-04-28 17:34:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google