Learning Robust Classifiers with Self-Guided Spurious Correlation Mitigation

要約

ディープニューラル分類器は、入力とターゲットの偽の属性間の偽の相関に依存して予測を行う傾向があり、これはその汎化能力を危険にさらす可能性がある。スプリアス相関にロバストな分類器の学習は、一般的にデータ中のスプリアス相関のアノテーションに依存するが、そのアノテーションの取得にはコストがかかることが多い。本論文では、アノテーションを必要としない設定に取り組み、自己誘導型スプリアス相関緩和フレームワークを提案する。本フレームワークは、経験的リスク最小化により得られた分類器のスプリアス相関に対する頑健性を向上させるために、その分類器に合わせたきめ細かい訓練ラベルを自動的に構築する。きめ細かな訓練ラベルは、新しいスプリアス埋め込み空間において識別された分類器の異なる予測動作で定式化される。この空間は、自動的に検出された概念属性と、クラスと属性の相関が予測に利用される可能性を測定する新しいスプリアス・メトリックで構成される。我々は、異なる予測行動を区別するために分類器を訓練することで、スプリアス相関を事前に知ることなく、スプリアス相関への依存を減少させ、5つの実世界データセットにおいて先行手法を凌駕することを実証する。

要約(オリジナル)

Deep neural classifiers tend to rely on spurious correlations between spurious attributes of inputs and targets to make predictions, which could jeopardize their generalization capability. Training classifiers robust to spurious correlations typically relies on annotations of spurious correlations in data, which are often expensive to get. In this paper, we tackle an annotation-free setting and propose a self-guided spurious correlation mitigation framework. Our framework automatically constructs fine-grained training labels tailored for a classifier obtained with empirical risk minimization to improve its robustness against spurious correlations. The fine-grained training labels are formulated with different prediction behaviors of the classifier identified in a novel spuriousness embedding space. We construct the space with automatically detected conceptual attributes and a novel spuriousness metric which measures how likely a class-attribute correlation is exploited for predictions. We demonstrate that training the classifier to distinguish different prediction behaviors reduces its reliance on spurious correlations without knowing them a priori and outperforms prior methods on five real-world datasets.

arxiv情報

著者 Guangtao Zheng,Wenqian Ye,Aidong Zhang
発行日 2024-05-06 17:12:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク