Identifying Spurious Correlations using Counterfactual Alignment

要約

偽の相関によって駆動されるモデルでは、汎化パフォーマンスが劣ることがよくあります。
我々は、ブラックボックス分類器の偽の相関を検出して定量化するための反事実(CF)アライメント法を提案します。
私たちの方法論は、ある分類子に関して生成された反事実画像が他の分類子に入力されることに基づいており、それらの分類子がこれらの分類子の出力にも変化を引き起こすかどうかを確認します。
これらの応答間の関係を定量化し、偽の相関が存在する特定のインスタンスを特定するために使用できます。
これは、顔属性と水鳥分類器の直感的な傾向を観察することによって、また偽の相関を作成し、その存在を視覚的および定量的に検出することによって検証されます。
さらに、CF アライメント法を利用して、スプリアス相関の減少を検出することで、ロバストな最適化法 (GroupDRO、JTT、FLAC) を評価できることを実証します。

要約(オリジナル)

Models driven by spurious correlations often yield poor generalization performance. We propose the counterfactual (CF) alignment method to detect and quantify spurious correlations of black box classifiers. Our methodology is based on counterfactual images generated with respect to one classifier being input into other classifiers to see if they also induce changes in the outputs of these classifiers. The relationship between these responses can be quantified and used to identify specific instances where a spurious correlation exists. This is validated by observing intuitive trends in face-attribute and waterbird classifiers, as well as by fabricating spurious correlations and detecting their presence, both visually and quantitatively. Furthermore, utilizing the CF alignment method, we demonstrate that we can evaluate robust optimization methods (GroupDRO, JTT, and FLAC) by detecting a reduction in spurious correlations.

arxiv情報

著者 Joseph Paul Cohen,Louis Blankemeier,Akshay Chaudhari
発行日 2025-01-15 17:11:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク