Rule Generation for Classification: Scalability, Interpretability, and Fairness

要約

制約を伴う分類のための新しいルールベースの最適化手法を導入します。
提案された方法は線形計画法の列生成を利用するため、大規模なデータセットに拡張可能です。
結果として生じる価格設定副問題は、NP-Hard であることが示されています。
私たちはデシジョン ツリー ベースのヒューリスティックを利用し、高速化のために代理価格設定のサブ問題を解決します。
このメソッドは、学習における各ルールの重要性を示す最適な重みとともにルールのセットを返します。
コスト係数をルールに割り当て、追加の制約を導入することで、解釈可能性と公平性に対処します。
特に、ローカルな解釈可能性に焦点を当て、複数の機密属性とクラスに対して公平性を保つための分離基準を一般化します。
データセットのコレクションで提案された方法論のパフォーマンスをテストし、そのさまざまな側面を詳しく説明するケーススタディを提示します。
提案されたルールベースの学習方法は、一方ではローカルな解釈可能性と公平性、もう一方では精度との間で良好な妥協点を示しています。

要約(オリジナル)

We introduce a new rule-based optimization method for classification with constraints. The proposed method leverages column generation for linear programming, and hence, is scalable to large datasets. The resulting pricing subproblem is shown to be NP-Hard. We recourse to a decision tree-based heuristic and solve a proxy pricing subproblem for acceleration. The method returns a set of rules along with their optimal weights indicating the importance of each rule for learning. We address interpretability and fairness by assigning cost coefficients to the rules and introducing additional constraints. In particular, we focus on local interpretability and generalize separation criterion in fairness to multiple sensitive attributes and classes. We test the performance of the proposed methodology on a collection of datasets and present a case study to elaborate on its different aspects. The proposed rule-based learning method exhibits a good compromise between local interpretability and fairness on the one side, and accuracy on the other side.

arxiv情報

著者 Adia C. Lumadjeng,Tabea Röber,M. Hakan Akyüz,Ş. İlker Birbil
発行日 2023-08-30 15:51:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク