CALDA: Improving Multi-Source Time Series Domain Adaptation with Contrastive Adversarial Learning

要約

教師なしドメイン適応 (UDA) は、グランド トゥルース ラベルにはアクセスできないが、関連する (ソース) ドメインでは見つかる、データが豊富な (ターゲット) ドメインでの機械学習のパフォーマンスを向上させる戦略を提供します。
ラベル配布などのメタドメイン情報が利用可能な場合、弱い監視によってパフォーマンスがさらに向上する可能性があります。
私たちは、これら 2 つの問題に取り組むための新しいフレームワーク CALDA を提案します。
CALDA は、対比学習と敵対的学習の原理を相乗的に組み合わせて、時系列データのマルチソース UDA (MS-UDA) を強力にサポートします。
従来の方法と同様に、CALDA は敵対的学習を利用してソースとターゲットの特徴表現を調整します。
以前のアプローチとは異なり、CALDA はさらに、ドメイン全体にわたるクロスソースのラベル情報を活用します。
CALDA は、同じラベルの例を互いに近づける一方で、異なるラベルの例を遠ざけ、対照的な学習を通じて空間を再形成します。
以前の対照的適応方法とは異なり、CALDA は時系列ではより困難になる可能性があるデータ拡張も擬似ラベル付けも必要としません。
私たちは提案したアプローチを経験的に検証します。
人間の活動認識、筋電図検査、および合成データセットの結果に基づいて、クロスソース情報を利用すると、以前の時系列および対照的な方法よりもパフォーマンスが向上することがわかりました。
弱い監視により、ノイズが存在する場合でもパフォーマンスがさらに向上し、CALDA が MS-UDA に一般化可能な戦略を提供できるようになります。
コードはhttps://github.com/floft/caldaから入手できます。

要約(オリジナル)

Unsupervised domain adaptation (UDA) provides a strategy for improving machine learning performance in data-rich (target) domains where ground truth labels are inaccessible but can be found in related (source) domains. In cases where meta-domain information such as label distributions is available, weak supervision can further boost performance. We propose a novel framework, CALDA, to tackle these two problems. CALDA synergistically combines the principles of contrastive learning and adversarial learning to robustly support multi-source UDA (MS-UDA) for time series data. Similar to prior methods, CALDA utilizes adversarial learning to align source and target feature representations. Unlike prior approaches, CALDA additionally leverages cross-source label information across domains. CALDA pulls examples with the same label close to each other, while pushing apart examples with different labels, reshaping the space through contrastive learning. Unlike prior contrastive adaptation methods, CALDA requires neither data augmentation nor pseudo labeling, which may be more challenging for time series. We empirically validate our proposed approach. Based on results from human activity recognition, electromyography, and synthetic datasets, we find utilizing cross-source information improves performance over prior time series and contrastive methods. Weak supervision further improves performance, even in the presence of noise, allowing CALDA to offer generalizable strategies for MS-UDA. Code is available at: https://github.com/floft/calda

arxiv情報

著者 Garrett Wilson,Janardhan Rao Doppa,Diane J. Cook
発行日 2023-07-21 16:05:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク