Improving Intervention Efficacy via Concept Realignment in Concept Bottleneck Models


コンセプト ボトルネック モデル (CBM) は、人間が理解できる概念に基づいてイメージを分類し、解釈可能なモデルの決定を可能にします。
重要なのは、CBM 設計では本質的に人間の介入が可能であり、熟練ユーザーには、解釈可能な方法でモデルの意思決定動作に影響を与えるために、潜在的にずれている概念の選択を修正する機能が与えられます。
この論文では、これが介入中の概念の独立した扱いによって著しく促進されており、1 つの概念の変更はモデルの最終決定における他の概念の使用に影響を与えないことを発見しました。
このヒューマン モデルとコラボレーションのコスト削減は、リソースに制約のある環境で CBM の実現可能性を高めるために非常に重要です。


Concept Bottleneck Models (CBMs) ground image classification on human-understandable concepts to allow for interpretable model decisions. Crucially, the CBM design inherently allows for human interventions, in which expert users are given the ability to modify potentially misaligned concept choices to influence the decision behavior of the model in an interpretable fashion. However, existing approaches often require numerous human interventions per image to achieve strong performances, posing practical challenges in scenarios where obtaining human feedback is expensive. In this paper, we find that this is noticeably driven by an independent treatment of concepts during intervention, wherein a change of one concept does not influence the use of other ones in the model’s final decision. To address this issue, we introduce a trainable concept intervention realignment module, which leverages concept relations to realign concept assignments post-intervention. Across standard, real-world benchmarks, we find that concept realignment can significantly improve intervention efficacy; significantly reducing the number of interventions needed to reach a target classification performance or concept prediction accuracy. In addition, it easily integrates into existing concept-based architectures without requiring changes to the models themselves. This reduced cost of human-model collaboration is crucial to enhancing the feasibility of CBMs in resource-constrained environments.


著者 Nishad Singhi,Jae Myung Kim,Karsten Roth,Zeynep Akata
発行日 2024-05-02 17:59:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク