Finding Minimum-Cost Explanations for Predictions made by Tree Ensembles

要約

機械学習モデルが特定の予測に到達する理由を説明する能力は、重要なシステムの人間のオペレーターによる意思決定支援として使用される場合に非常に重要です。
提供される説明は証明可能で正しい必要があり、できれば冗長な情報がなく、最小限の説明と呼ばれます。
この論文では、最小であるだけでなく、コスト関数に関しても最小であるツリーアンサンブルによって行われた予測の説明を見つけることを目的としています。
この目的のために、説明の正確性を判断できる非常に効率的なオラクルを最初に提示し、最小限の説明を計算するときに、現在の最先端の代替手段の実行時パフォーマンスを数桁上回ります。
次に、関連する研究から MARCO と呼ばれるアルゴリズム (m-MARCO と呼びます) を適応させて、予測ごとに 1 つの最小説明を計算し、すべての最小説明を列挙する MARCO アルゴリズムと比較して、2 倍の全体的なスピードアップ係数を示します。
最後に、さまざまなユースケースから得られた説明を研究し、それらの特性のさらなる洞察につながります。
特に、いくつかのケースでは、1 つの予測に対して 100,000 を超える最小限の説明から選択できることがわかります。
これらの場合、最小限の説明のごく一部のみが最小限であり、最小限の説明は冗長性が大幅に低いことがわかり、この作業の目的を動機付けます。

要約(オリジナル)

The ability to explain why a machine learning model arrives at a particular prediction is crucial when used as decision support by human operators of critical systems. The provided explanations must be provably correct, and preferably without redundant information, called minimal explanations. In this paper, we aim at finding explanations for predictions made by tree ensembles that are not only minimal, but also minimum with respect to a cost function. To this end, we first present a highly efficient oracle that can determine the correctness of explanations, surpassing the runtime performance of current state-of-the-art alternatives by several orders of magnitude when computing minimal explanations. Secondly, we adapt an algorithm called MARCO from related works (calling it m-MARCO) for the purpose of computing a single minimum explanation per prediction, and demonstrate an overall speedup factor of two compared to the MARCO algorithm which enumerates all minimal explanations. Finally, we study the obtained explanations from a range of use cases, leading to further insights of their characteristics. In particular, we observe that in several cases, there are more than 100,000 minimal explanations to choose from for a single prediction. In these cases, we see that only a small portion of the minimal explanations are also minimum, and that the minimum explanations are significantly less verbose, hence motivating the aim of this work.

arxiv情報

著者 John Törnblom,Emil Karlsson,Simin Nadjm-Tehrani
発行日 2023-03-16 12:53:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク