要約
機械学習は通常、訓練とテストの分布が同一であり、訓練とテストのためにデータが一元的に保存されているという仮定に依存している。しかし、実世界のシナリオでは、分布が大きく異なる場合があり、データが異なるデバイス、組織、またはエッジノードに分散していることがよくあります。そのため、データが異なるドメインに分散している未知の分布に対して効果的に汎化できるモデルを開発することが不可欠です。この課題に対応するため、近年、連携ドメイン汎化(FDG)への関心が急増している。FDGは、連合学習(FL)とドメイン汎化(DG)技術の長所を組み合わせ、データのプライバシーを保ちながら、複数のソースドメインが未知のドメインに直接汎化できるモデルを協調学習できるようにする。しかしながら、ドメインシフトの下で連携モデルを汎化することは技術的に困難な問題であり、これまでの研究領域ではほとんど注目されてこなかった。本稿では、この分野における最近の進歩に関する最初のサーベイを行う。最初に、伝統的な機械学習から、ドメイン適応とドメイン汎化への発展プロセスを議論し、それに対応する正式な定義を提供する。次に、最近の方法論を4つのクラスに分類する:連携ドメインアライメント、データ操作、学習戦略、集約最適化。次に、よく使われるデータセット、アプリケーション、評価、ベンチマークを紹介する。最後に、将来の潜在的な研究テーマをいくつか提示して、このサーベイを締めくくる。
要約(オリジナル)
Machine learning typically relies on the assumption that training and testing distributions are identical and that data is centrally stored for training and testing. However, in real-world scenarios, distributions may differ significantly and data is often distributed across different devices, organizations, or edge nodes. Consequently, it is imperative to develop models that can effectively generalize to unseen distributions where data is distributed across different domains. In response to this challenge, there has been a surge of interest in federated domain generalization (FDG) in recent years. FDG combines the strengths of federated learning (FL) and domain generalization (DG) techniques to enable multiple source domains to collaboratively learn a model capable of directly generalizing to unseen domains while preserving data privacy. However, generalizing the federated model under domain shifts is a technically challenging problem that has received scant attention in the research area so far. This paper presents the first survey of recent advances in this area. Initially, we discuss the development process from traditional machine learning to domain adaptation and domain generalization, leading to FDG as well as provide the corresponding formal definition. Then, we categorize recent methodologies into four classes: federated domain alignment, data manipulation, learning strategies, and aggregation optimization, and present suitable algorithms in detail for each category. Next, we introduce commonly used datasets, applications, evaluations, and benchmarks. Finally, we conclude this survey by providing some potential research topics for the future.
arxiv情報
著者 | Ying Li,Xingwei Wang,Rongfei Zeng,Praveen Kumar Donta,Ilir Murturi,Min Huang,Schahram Dustdar |
発行日 | 2024-03-01 14:05:48+00:00 |
arxivサイト | arxiv_id(pdf) |