要約
それぞれがデータを収集する多数の IoT デバイスの接続では、通常、機械学習モデルのトレーニングには、厳格なプライバシー ルールが必要な中央サーバーへのデータの送信が含まれます。
ただし、データのセキュリティ上の懸念から、データを社外に持ち出すことに消極的な所有者もいます。
分散型機械学習アプローチとしてのフェデレーション ラーニング (FL) は、データを収集したデバイス自体で機械学習モデルのトレーニングを実行します。
このシナリオでは、データはトレーニング目的でネットワーク上で共有されません。
FL アルゴリズムの 1 つである Fedavg を使用すると、トレーニング セッション中にモデルを参加デバイスにコピーできます。
デバイスはランダムに選択することができ、デバイスを中止することもできます。
結果のモデルは調整サーバーに送信され、トレーニングを終了したデバイスからのモデルが平均化されます。
所望のモデル精度が達成されるまで、このプロセスが繰り返されます。
これにより、FL のアプローチは、所有者の機密データを保持していた IoT/IIoT デバイスのプライバシー問題を解決します。
このペーパーでは、FL の利点を活用し、最新の IoT/IIoT デバイス ネットワークを表す最近のデータセットに Fedavg アルゴリズムを実装しました。
結果は、集中型機械学習アプローチとほぼ同じでした。
また、困難なデバイスがトレーニングの各段階に参加しない場合にトレーニング中に発生する不公平など、Fedavg のいくつかの欠点も評価しました。
このローカルまたはグローバル モデルの非効率的なトレーニングにより、Fedavg を使用して開発された IoT/IIoT ガジェットの侵入検知システムで多数の誤警報が発生する可能性があります。
したがって、集中型ディープオートエンコーダMLを使用してFedAvディープオートエンコーダを評価した後、将来の研究で評価されるFair Fedavgアルゴリズムをさらに提案および設計しました。
要約(オリジナル)
In a connection of many IoT devices that each collect data, normally training a machine learning model would involve transmitting the data to a central server which requires strict privacy rules. However, some owners are reluctant of availing their data out of the company due to data security concerns. Federated learning(FL) as a distributed machine learning approach performs training of a machine learning model on the device that gathered the data itself. In this scenario, data is not share over the network for training purpose. Fedavg as one of FL algorithms permits a model to be copied to participating devices during a training session. The devices could be chosen at random, and a device can be aborted. The resulting models are sent to the coordinating server and then average models from the devices that finished training. The process is repeated until a desired model accuracy is achieved. By doing this, FL approach solves the privacy problem for IoT/ IIoT devices that held sensitive data for the owners. In this paper, we leverage the benefits of FL and implemented Fedavg algorithm on a recent dataset that represent the modern IoT/ IIoT device networks. The results were almost the same as the centralized machine learning approach. We also evaluated some shortcomings of Fedavg such as unfairness that happens during the training when struggling devices do not participate for every stage of training. This inefficient training of local or global model could lead in a high number of false alarms in intrusion detection systems for IoT/IIoT gadgets developed using Fedavg. Hence, after evaluating the FedAv deep auto encoder with centralized deep auto encoder ML, we further proposed and designed a Fair Fedavg algorithm that will be evaluated in the future work.
arxiv情報
著者 | Niyomukiza Thamar,Hossam Samy Elsaid Sharara |
発行日 | 2023-08-23 14:53:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google