Using Explanations to Guide Models

要約

ディープ ニューラル ネットワークは高性能ですが、特定のクラスと同時発生するスプリアスまたはバックグラウンドの特徴に基づいて決定を下す可能性があり、一般化を損なう可能性があります。
この問題を軽減するために、「モデル ガイダンス」の使用が最近人気を博しています。このため、モデルの説明を正規化して適切な機能を強調することにより、モデルは「正しい理由で正しい」ように導かれます。
ただし、これらのアプローチの実験的検証は、これまでのところ、比較的単純なデータセットや合成データセットに限定されていました。
どのモデル ガイド アプローチがより困難な実世界のデータセットに実際に移行するかをよりよく理解するために、この作業では、さまざまな損失関数、帰属方法、モデル、および PASCAL VOC の「ガイダンスの深さ」にわたって詳細な評価を行います。
2007 および MS COCO 2014 のデータセットであり、モデル ガイダンスによってモデルのパフォーマンスが向上することさえあることが示されています。
これに関連して、我々はさらに新しいエネルギー損失を提案し、モデルがオブジェクトの特徴に焦点を当てるように指示する際のその有効性を示します。
また、境界ボックスの注釈のごく一部 (1% など) でもこれらの利点を達成できることを示し、このアプローチの費用対効果を強調しています。
最後に、このアプローチが分布シフト下での一般化も改善できることを示します。
コードが利用可能になります。

要約(オリジナル)

Deep neural networks are highly performant, but might base their decision on spurious or background features that co-occur with certain classes, which can hurt generalization. To mitigate this issue, the usage of ‘model guidance’ has gained popularity recently: for this, models are guided to be ‘right for the right reasons’ by regularizing the models’ explanations to highlight the right features. Experimental validation of these approaches has thus far however been limited to relatively simple and / or synthetic datasets. To gain a better understanding of which model-guiding approaches actually transfer to more challenging real-world datasets, in this work we conduct an in-depth evaluation across various loss functions, attribution methods, models, and ‘guidance depths’ on the PASCAL VOC 2007 and MS COCO 2014 datasets, and show that model guidance can sometimes even improve model performance. In this context, we further propose a novel energy loss, show its effectiveness in directing the model to focus on object features. We also show that these gains can be achieved even with a small fraction (e.g. 1%) of bounding box annotations, highlighting the cost effectiveness of this approach. Lastly, we show that this approach can also improve generalization under distribution shifts. Code will be made available.

arxiv情報

著者 Sukrut Rao,Moritz Böhle,Amin Parchami-Araghi,Bernt Schiele
発行日 2023-03-21 15:34:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク