Mechanistic Mode Connectivity

要約

タイトル:Mechanistic Mode Connectivity(メカニスティックモード接続)

要約:

– 人工ニューラルネットワークは、データセット上のトレーニングによって取得された最小化関数を経由して、低損失の単純な経路によって接続されることがある。(mode connectivity)
– この研究では、異なるメカニズムを用いて予測を行う最適化器が、低い損失の単純なパスを通じて接続されているかどうかについて調査している。
– 入力変換に共通した不変性を共有するメカニスティックシミラリティの定義を提供し、2つのモデル間に線形接続がないことは、予測のために異なるメカニズムを使用していることを意味する。
– 研究結果は、一般的な偶然な地蔵的属性の要求に対して、持続可能なモデルに対するナイーブな微調整法が失敗することを示唆する。
– この分析によって、予測メカニズムのターゲット変更を可能にする手法「Connectivity-based Fine Tuning (CBFT)」を提唱し、偽の属性への依存性を減らすための合成データセットのタスクを実行している。

要約(オリジナル)

We study neural network loss landscapes through the lens of mode connectivity, the observation that minimizers of neural networks retrieved via training on a dataset are connected via simple paths of low loss. Specifically, we ask the following question: are minimizers that rely on different mechanisms for making their predictions connected via simple paths of low loss? We provide a definition of mechanistic similarity as shared invariances to input transformations and demonstrate that lack of linear connectivity between two models implies they use dissimilar mechanisms for making their predictions. Relevant to practice, this result helps us demonstrate that naive fine-tuning on a downstream dataset can fail to alter a model’s mechanisms, e.g., fine-tuning can fail to eliminate a model’s reliance on spurious attributes. Our analysis also motivates a method for targeted alteration of a model’s mechanisms, named connectivity-based fine-tuning (CBFT), which we analyze using several synthetic datasets for the task of reducing a model’s reliance on spurious attributes.

arxiv情報

著者 Ekdeep Singh Lubana,Eric J. Bigelow,Robert P. Dick,David Krueger,Hidenori Tanaka
発行日 2023-04-26 04:44:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG パーマリンク