Short Boolean Formulas as Explanations in Practice

要約

単項関係に基づいたデータ モデル内の短いブール式を介して説明可能性を調査します。
長さ k の説明として、説明対象の属性との誤差を最小にする長さ k のブール式を採用します。
まず、このシナリオで予想される誤差の新しい定量的境界を提供します。
次に、3 つの具体的なデータセットを研究することによって、設定が実際にどのように機能するかを示します。
それぞれの場合において、解答セット プログラミングのエンコーディングを使用して、さまざまな長さの説明式を計算します。
私たちが取得した最も正確な式では、同じデータセットに対する他の方法と同様の誤差が生じます。
ただし、過学習により、これらの式は必ずしも理想的な説明になるとは限りません。そのため、相互検証を使用して説明に適切な長さを特定します。
短い数式に限定することで、過学習を回避しながらも適度に正確で、重要なことに人間が解釈可能な説明が得られます。

要約(オリジナル)

We investigate explainability via short Boolean formulas in the data model based on unary relations. As an explanation of length k, we take a Boolean formula of length k that minimizes the error with respect to the target attribute to be explained. We first provide novel quantitative bounds for the expected error in this scenario. We then also demonstrate how the setting works in practice by studying three concrete data sets. In each case, we calculate explanation formulas of different lengths using an encoding in Answer Set Programming. The most accurate formulas we obtain achieve errors similar to other methods on the same data sets. However, due to overfitting, these formulas are not necessarily ideal explanations, so we use cross validation to identify a suitable length for explanations. By limiting to shorter formulas, we obtain explanations that avoid overfitting but are still reasonably accurate and also, importantly, human interpretable.

arxiv情報

著者 Reijo Jaakkola,Tomi Janhunen,Antti Kuusisto,Masood Feyzbakhsh Rankooh,Miikka Vilander
発行日 2023-12-21 14:25:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.LO, F.4.1 パーマリンク