Shortcut Detection with Variational Autoencoders

要約

機械学習(ML)の実世界での応用では、モデルがデータ中のスプリアスな相関ではなく、うまく一般化された特徴に基づいた予測を行うことが不可欠である。このような偽相関の識別は、ショートカットとしても知られ、困難な問題であり、これまでほとんど対処されてこなかった。本研究では、変分オートエンコーダ(VAE)を用いて、画像や音声データからショートカットを検出する新しいアプローチを提案する。VAEの潜在空間における特徴の分離により、データセット内の相関を発見し、MLショートカットのために半自動的に評価することができる。我々は、いくつかの実世界のデータセットで本手法の適用性を実証し、これまで発見されていないショートカットを発見する。また、これらの知見に基づき、ショートカットの敵対的な例の構築についても検討する。

要約(オリジナル)

For real-world applications of machine learning (ML), it is essential that models make predictions based on well-generalizing features rather than spurious correlations in the data. The identification of such spurious correlations, also known as shortcuts, is a challenging problem and has so far been scarcely addressed. In this work, we present a novel approach to detect shortcuts in image and audio datasets by leveraging variational autoencoders (VAEs). The disentanglement of features in the latent space of VAEs allows us to discover correlations in datasets and semi-automatically evaluate them for ML shortcuts. We demonstrate the applicability of our method on several real-world datasets and identify shortcuts that have not been discovered before. Based on these findings, we also investigate the construction of shortcut adversarial examples.

arxiv情報

著者 Nicolas M. Müller,Simon Roschmann,Shahbaz Khan,Philip Sperl,Konstantin Böttinger
発行日 2023-02-08 18:26:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク