Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment

要約

コンピューター ビジョンや生物医学データなどの信号に関する機械学習アプリケーションは、ハードウェア デバイスやセッション記録間に存在する変動性により、多くの場合、重大な課題に直面します。
トレーニング データとテスト データの分布が異なることが多いため、この変動によりドメイン アダプテーション (DA) の問題が生じます。
この研究では、これらの変動を軽減するために時空間モンジュ アライメント (STMA) を提案します。
この最適トランスポート (OT) ベースの方法は、多変量信号をソース ドメイン (マルチソース DA) のワッサーシュタイン重心にマッピングすることで、多変量​​信号のクロスパワー スペクトル密度 (クロス PSD) を適応させます。
新しいドメインの予測は、ソース データ (テスト時 DA) を使用してモデルを再トレーニングする必要なく、フィルター処理を使用して実行できます。
また、この方法の 2 つの特殊なケースである時間モンジュ アライメント (TMA) と空間モンジュ アライメント (SMA) についても研究し、説明します。
マッピング推定に対して非漸近的な濃度限界が導出され、$n_ で $\mathcal{O}(n_\ell^{-1/2})$ の分散減衰率を持つバイアスプラス分散誤差構造が明らかになります。
\ell$ 信号の長さ。
この理論的な保証は、提案された計算スキーマの効率を実証します。
多変量生体信号と画像データに関する数値実験では、STMA が非常に異なる設定で取得されたデータセット間で大幅かつ一貫したパフォーマンスの向上につながることが示されています。
特に、STMA は最先端の深層学習手法を補完する前処理ステップです。

要約(オリジナル)

Machine learning applications on signals such as computer vision or biomedical data often face significant challenges due to the variability that exists across hardware devices or session recordings. This variability poses a Domain Adaptation (DA) problem, as training and testing data distributions often differ. In this work, we propose Spatio-Temporal Monge Alignment (STMA) to mitigate these variabilities. This Optimal Transport (OT) based method adapts the cross-power spectrum density (cross-PSD) of multivariate signals by mapping them to the Wasserstein barycenter of source domains (multi-source DA). Predictions for new domains can be done with a filtering without the need for retraining a model with source data (test-time DA). We also study and discuss two special cases of the method, Temporal Monge Alignment (TMA) and Spatial Monge Alignment (SMA). Non-asymptotic concentration bounds are derived for the mappings estimation, which reveals a bias-plus-variance error structure with a variance decay rate of $\mathcal{O}(n_\ell^{-1/2})$ with $n_\ell$ the signal length. This theoretical guarantee demonstrates the efficiency of the proposed computational schema. Numerical experiments on multivariate biosignals and image data show that STMA leads to significant and consistent performance gains between datasets acquired with very different settings. Notably, STMA is a pre-processing step complementary to state-of-the-art deep learning methods.

arxiv情報

著者 Théo Gnassounou,Antoine Collas,Rémi Flamary,Karim Lounici,Alexandre Gramfort
発行日 2024-07-19 13:33:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, eess.SP パーマリンク