Temporal Test-Time Adaptation with State-Space Models

要約

トレーニング データとテスト データの間の分布の変化は、デプロイされたモデルのライフサイクル全体にわたって避けられず、パフォーマンスの低下につながります。
テスト サンプルにモデルを適応させると、このパフォーマンスの低下を軽減できます。
しかし、ほとんどのテスト時適応手法は合成破損の変化に焦点を当てており、さまざまな分布の変化は十分に調査されていません。
この論文では、時間の経過とともに徐々に進化する分布の変化に焦点を当てます。これは、実際には一般的ですが、既存の手法では困難であることがわかります。
これに対処するために、我々は STAD を提案します。STAD は、隠れた特徴の最後のセットの時間変化するダイナミクスを学習することで、展開されたモデルを時間的分布の変化に適応させる確率的状態空間モデルです。
ラベルを必要とせずに、私たちのモデルは、動的分類ヘッドとして機能する時間進化するクラス プロトタイプを推測します。
現実世界の時間的分布シフトに関する実験を通じて、私たちの方法が小さなバッチサイズとラベルシフトの処理に優れていることを示します。

要約(オリジナル)

Distribution shifts between training and test data are inevitable over the lifecycle of a deployed model, leading to performance decay. Adapting a model on test samples can help mitigate this drop in performance. However, most test-time adaptation methods have focused on synthetic corruption shifts, leaving a variety of distribution shifts underexplored. In this paper, we focus on distribution shifts that evolve gradually over time, which are common in the wild but challenging for existing methods, as we show. To address this, we propose STAD, a probabilistic state-space model that adapts a deployed model to temporal distribution shifts by learning the time-varying dynamics in the last set of hidden features. Without requiring labels, our model infers time-evolving class prototypes that act as a dynamic classification head. Through experiments on real-world temporal distribution shifts, we show that our method excels in handling small batch sizes and label shift.

arxiv情報

著者 Mona Schirmer,Dan Zhang,Eric Nalisnick
発行日 2024-10-02 17:29:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, stat.ML パーマリンク