要約
分類タスクでは、反事実の説明は、入力を好ましいクラスに分類するために必要な最小限の変更を提供します。
私たちは、入力サンプルの特定の特徴が変更できないこと、つまり \emph{immutable} であることを強制しながら、受け入れられたサンプルのデータベースから正確に最も近い反事実を非公開で取得するという問題を考えます。
機械学習モデルによって特徴ベクトルが拒否された申請者 (ユーザー) は、不変セットを構成する特徴のプライベート サブセットを変更せずに、データベース内で自分に最も近いサンプルを取得したいと考えています。
これを行う間、ユーザーは、特徴ベクトル、不変セット、および結果として得られる反事実インデックス情報を、理論的には機関に対して非公開にしておく必要があります。
私たちはこれを不変のプライベート反事実検索 (I-PCR) 問題と呼び、PCR をより実用的な設定に一般化します。
この論文では、私的情報検索 (PIR) の技術を活用して 2 つの I-PCR スキームを提案し、その通信コストを特徴付けます。
さらに、ユーザーがデータベースについて学習した情報を定量化し、提案されたスキームと比較します。
要約(オリジナル)
In a classification task, counterfactual explanations provide the minimum change needed for an input to be classified into a favorable class. We consider the problem of privately retrieving the exact closest counterfactual from a database of accepted samples while enforcing that certain features of the input sample cannot be changed, i.e., they are \emph{immutable}. An applicant (user) whose feature vector is rejected by a machine learning model wants to retrieve the sample closest to them in the database without altering a private subset of their features, which constitutes the immutable set. While doing this, the user should keep their feature vector, immutable set and the resulting counterfactual index information-theoretically private from the institution. We refer to this as immutable private counterfactual retrieval (I-PCR) problem which generalizes PCR to a more practical setting. In this paper, we propose two I-PCR schemes by leveraging techniques from private information retrieval (PIR) and characterize their communication costs. Further, we quantify the information that the user learns about the database and compare it for the proposed schemes.
arxiv情報
著者 | Shreya Meel,Pasan Dissanayake,Mohamed Nomeir,Sanghamitra Dutta,Sennur Ulukus |
発行日 | 2024-11-15 18:50:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google