要約
近年、CRO:Flfederated Learning(FL)は、機械学習コミュニティ内で大きな注目を集めています。
文献ではさまざまなFLアルゴリズムが提案されていますが、クライアント全体のデータが非依存的で同一に分布している場合(非IID)、そのパフォーマンスはしばしば低下します。
データ分布のこの歪度は、多くの場合、地理的パターンから生まれ、テキストデータの地域的な言語的変動や都市環境のローカライズされた交通パターンなどの顕著な例があります。
このようなシナリオは、特定の領域内でIIDデータをもたらしますが、地域全体で非IIDデータになります。
ただし、既存のFLアルゴリズムは、通常、デバイス間で非IIDデータをランダムに分割することによって評価され、空間分布を無視することによって評価されます。
このギャップに対処するために、さまざまな地域でさまざまな程度の歪度でデータ分割をシミュレートするベンチマークであるProfedを紹介します。
文献からいくつかの歪度方法を組み込み、Mnist、FashionMnist、CIFAR-10、CIFAR-100などのよく知られたデータセットに適用します。
私たちの目標は、FLアルゴリズムをより効果的かつ一貫して確立されたベースラインに対して評価するための標準化されたフレームワークを研究者に提供することです。
要約(オリジナル)
In recent years, cro:flFederated learning (FL) has gained significant attention within the machine learning community. Although various FL algorithms have been proposed in the literature, their performance often degrades when data across clients is non-independently and identically distributed (non-IID). This skewness in data distribution often emerges from geographic patterns, with notable examples including regional linguistic variations in text data or localized traffic patterns in urban environments. Such scenarios result in IID data within specific regions but non-IID data across regions. However, existing FL algorithms are typically evaluated by randomly splitting non-IID data across devices, disregarding their spatial distribution. To address this gap, we introduce ProFed, a benchmark that simulates data splits with varying degrees of skewness across different regions. We incorporate several skewness methods from the literature and apply them to well-known datasets, including MNIST, FashionMNIST, CIFAR-10, and CIFAR-100. Our goal is to provide researchers with a standardized framework to evaluate FL algorithms more effectively and consistently against established baselines.
arxiv情報
著者 | Davide Domini,Gianluca Aguzzi,Mirko Viroli |
発行日 | 2025-03-26 15:08:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google