Representer Point Selection for Explaining Regularized High-dimensional Models


私たちは、高次元表現者と呼ぶサンプルベースの説明の新しいクラスを導入します。これは、各トレーニング サンプルの重要度の重みの観点から、正則化された高次元モデルの予測を説明するために使用できます。
私たちの主力は、一般的な正則化された高次元モデルの新しい表現定理であり、各トレーニング サンプルからの寄与という観点からモデルの予測を分解します。正の (負の) 値は、モデルの予測に対するトレーニング サンプルの正の (負の) 影響に対応します。

$\ell_1$ の正規化されたスパース モデルと核ノルムの正規化された低ランク モデルの正規インスタンスの結果を導き出します。
ケーススタディとして、協調フィルタリングのコンテキストにおける低ランク モデルの適用をさらに調査します。そこでは、モデルの特定の人気クラスの高次元表現をインスタンス化します。
最後に、3 つの現実世界のバイナリ分類データセットと 2 つのレコメンダー システム データセットに対する提案手法の実験的パフォーマンスを研究します。


We introduce a novel class of sample-based explanations we term high-dimensional representers, that can be used to explain the predictions of a regularized high-dimensional model in terms of importance weights for each of the training samples. Our workhorse is a novel representer theorem for general regularized high-dimensional models, which decomposes the model prediction in terms of contributions from each of the training samples: with positive (negative) values corresponding to positive (negative) impact training samples to the model’s prediction. We derive consequences for the canonical instances of $\ell_1$ regularized sparse models, and nuclear norm regularized low-rank models. As a case study, we further investigate the application of low-rank models in the context of collaborative filtering, where we instantiate high-dimensional representers for specific popular classes of models. Finally, we study the empirical performance of our proposed methods on three real-world binary classification datasets and two recommender system datasets. We also showcase the utility of high-dimensional representers in explaining model recommendations.


著者 Che-Ping Tsai,Jiong Zhang,Eli Chien,Hsiang-Fu Yu,Cho-Jui Hsieh,Pradeep Ravikumar
発行日 2023-05-31 16:23:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク