Identifying Spurious Correlations and Correcting them with an Explanation-based Learning

要約

訓練されたモデルによって学習された誤った相関関係を特定することは、訓練されたモデルを改良し、信頼できるモデルを構築するための核心です。
画像分類問題用にトレーニングされたモデルによって学習された偽の相関を識別する簡単な方法を提示します。
画像レベルの摂動を適用し、トレーニング済みモデルを使用して行われた予測の確実性の変化を監視します。
合成的に生成されたスプリアス領域を含む画像を含む画像分類データセットを使用してこのアプローチを示し、トレーニングされたモデルがスプリアス領域に過度に依存していたことを示します。
さらに、説明ベースの学習アプローチを使用して、学習した誤った相関関係を削除します。

要約(オリジナル)

Identifying spurious correlations learned by a trained model is at the core of refining a trained model and building a trustworthy model. We present a simple method to identify spurious correlations that have been learned by a model trained for image classification problems. We apply image-level perturbations and monitor changes in certainties of predictions made using the trained model. We demonstrate this approach using an image classification dataset that contains images with synthetically generated spurious regions and show that the trained model was overdependent on spurious regions. Moreover, we remove the learned spurious correlations with an explanation based learning approach.

arxiv情報

著者 Misgina Tsighe Hagos,Kathleen M. Curran,Brian Mac Namee
発行日 2022-11-15 16:34:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク