要約
基礎モデル (FM) の進歩により、機械学習のパラダイムシフトが起こりました。
これらの事前トレーニングされた大規模 FM からの豊かで表現力豊かな特徴表現は、通常、表現に続く浅い完全接続ネットワークの軽量微調整を介して、複数の下流タスクに活用されます。
ただし、この予測パイプラインは解釈不可能でブラックボックスであるため、特に医療、金融、セキュリティなどの重要な領域では課題となる可能性があります。
このペーパーでは、高レベルの概念ベクトルを使用して、複雑で解釈不可能な基礎モデルを解釈可能な意思決定パイプラインに変換するコンセプト ボトルネック モデル (CBM) の可能性を探ります。
具体的には、入力分布が元のトレーニング分布からシフトすることが多い、このような解釈可能な CBM パイプラインの「実際の」テスト時のデプロイメントに焦点を当てています。
まず、さまざまな種類の分配シフトの下でそのようなパイプラインの潜在的な故障モードを特定します。
次に、これらの障害モードに対処するための適応型コンセプト ボトルネック フレームワークを提案します。このフレームワークは、ソース (トレーニング) データセットにアクセスせず、ターゲット ドメインからのラベルなしデータのみに基づいて概念ベクトル バンクと予測層を動的に適応させます。
現実世界のさまざまな分布シフトによる経験的評価では、当社の適応方法がテスト データとよりよく整合した概念ベースの解釈を生成し、展開後の精度を最大 28% 向上させ、CBM パフォーマンスを解釈不可能な分類のパフォーマンスと一致させることが示されています。
要約(オリジナル)
Advancements in foundation models (FMs) have led to a paradigm shift in machine learning. The rich, expressive feature representations from these pre-trained, large-scale FMs are leveraged for multiple downstream tasks, usually via lightweight fine-tuning of a shallow fully-connected network following the representation. However, the non-interpretable, black-box nature of this prediction pipeline can be a challenge, especially in critical domains such as healthcare, finance, and security. In this paper, we explore the potential of Concept Bottleneck Models (CBMs) for transforming complex, non-interpretable foundation models into interpretable decision-making pipelines using high-level concept vectors. Specifically, we focus on the test-time deployment of such an interpretable CBM pipeline ‘in the wild’, where the input distribution often shifts from the original training distribution. We first identify the potential failure modes of such a pipeline under different types of distribution shifts. Then we propose an adaptive concept bottleneck framework to address these failure modes, that dynamically adapts the concept-vector bank and the prediction layer based solely on unlabeled data from the target domain, without access to the source (training) dataset. Empirical evaluations with various real-world distribution shifts show that our adaptation method produces concept-based interpretations better aligned with the test data and boosts post-deployment accuracy by up to 28%, aligning the CBM performance with that of non-interpretable classification.
arxiv情報
著者 | Jihye Choi,Jayaram Raghuram,Yixuan Li,Somesh Jha |
発行日 | 2024-12-18 17:47:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google