Multi-Class Explainable Unlearning for Image Classification via Weight Filtering

要約

タイトル: 画像分類における重みフィルタリングによる多クラス説明可能なアンラーニング
要約:
– 類似した研究では、ネットワークから訓練データの影響を選択的に除去するために、訓練データの小規模なサブセットまたは単一クラスに焦点を当ててきた。
– 本論文では、異なるアプローチを取り、画像分類ネットワークのすべてのクラスを1回のアンチェイニングラウンドでアンラーンできるフレームワークを考案した。
– 提案手法は、メモリ行列を介した画像分類ネットワークの内部構成を調整することを学び、トレーニング後、同じネットワークが任意のクラスに対して選択的にアンラーニング動作を示すようにします。
– クラスごとに特定された重みを発見することにより、アプローチは設計上説明可能なクラスの表現も回復します。
– 提案されたフレームワーク(WF-Net)は、CNNおよびTransformerベースのバックボーンを持つ小規模および中規模の画像分類データセットでテストされました。
– 本研究は、アンラーニングに対する説明可能なソリューションの開発において興味深い洞察を提供し、他のビジョンタスクにも容易に拡張できる可能性があります。

要約(オリジナル)

Machine Unlearning has recently been emerging as a paradigm for selectively removing the impact of training datapoints from a network. While existing approaches have focused on unlearning either a small subset of the training data or a single class, in this paper we take a different path and devise a framework that can unlearn all classes of an image classification network in a single untraining round. Our proposed technique learns to modulate the inner components of an image classification network through memory matrices so that, after training, the same network can selectively exhibit an unlearning behavior over any of the classes. By discovering weights which are specific to each of the classes, our approach also recovers a representation of the classes which is explainable by-design. We test the proposed framework, which we name Weight Filtering network (WF-Net), on small-scale and medium-scale image classification datasets, with both CNN and Transformer-based backbones. Our work provides interesting insights in the development of explainable solutions for unlearning and could be easily extended to other vision tasks.

arxiv情報

著者 Samuele Poppi,Sara Sarto,Marcella Cornia,Lorenzo Baraldi,Rita Cucchiara
発行日 2023-04-04 18:01:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク