The Applicability of Federated Learning to Official Statistics

要約

この研究では、公式統計に対する Federated Learning (FL) の可能性を調査し、FL モデルのパフォーマンスが集中学習手法にどの程度追いつくことができるかを示しています。
同時に、その利用によりデータ所有者のプライバシーを保護できるため、より広範囲のデータへのアクセスが容易になり、最終的には公式統計が強化されます。
3 つの異なるユースケースをシミュレーションすることで、テクノロジーの適用可能性に関する重要な洞察が得られます。
このユースケースは、医療保険データ セット、粉塵汚染データ セット、モバイル無線通信範囲データ セットに基づいており、これらはすべて公式統計に近い領域からのものです。
各シミュレーションの集中アルゴリズムと FL アルゴリズムのパフォーマンスの比較など、結果の詳細な分析を提供します。
3 つのユースケースすべてで、FL を介してモデルをトレーニングすることができ、集中型モデルのベンチマークに非常に近いパフォーマンスに達しました。
私たちの主な観察結果と、シミュレーションを実践に移す上でのその影響がまとめられています。
私たちは、FL が将来の公的統計のユースケースにおいて極めて重要なテクノロジーとして浮上する可能性があるという結論に達しました。

要約(オリジナル)

This work investigates the potential of Federated Learning (FL) for official statistics and shows how well the performance of FL models can keep up with centralized learning methods. At the same time, its utilization can safeguard the privacy of data holders, thus facilitating access to a broader range of data and ultimately enhancing official statistics. By simulating three different use cases, important insights on the applicability of the technology are gained. The use cases are based on a medical insurance data set, a fine dust pollution data set and a mobile radio coverage data set – all of which are from domains close to official statistics. We provide a detailed analysis of the results, including a comparison of centralized and FL algorithm performances for each simulation. In all three use cases, we were able to train models via FL which reach a performance very close to the centralized model benchmarks. Our key observations and their implications for transferring the simulations into practice are summarized. We arrive at the conclusion that FL has the potential to emerge as a pivotal technology in future use cases of official statistics.

arxiv情報

著者 Joshua Stock,Oliver Hauke,Julius Weißmann,Hannes Federrath
発行日 2023-07-28 11:58:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク