Fair Distributed Cooperative Bandit Learning on Networks for Intelligent Internet of Things Systems (Technical Report)

要約

インテリジェントなモノのインターネット (IoT) システムでは、ネットワーク内のエッジ サーバーが隣接するサーバーと情報を交換し、センサーからデータを収集して、提供されたタスクを完了します。
この論文では、データ収集を容易にし、公平性の考慮事項を組み込むために、インテリジェント IoT システム用のマルチプレイヤー マルチアーム バンディット モデルを提案します。
私たちのモデルでは、サーバーが近隣サーバーと連携するのに役立つ効果的な通信プロトコルを確立します。
次に、分散型協調バンディット アルゴリズム DC-ULCB を設計し、サーバーがセンサーを協力して選択して、選択の公平性を維持しながらデータ レートを最大化できるようにします。
我々は、DC-ULCB の報酬リグロングと公平性リグロングの分析を実行し、両方のリグロングが対数のインスタンス依存の上限を持つことを証明します。
さらに、広範なシミュレーションを通じて、DC-ULCB が報酬の最大化と公平性の確保において既存のアルゴリズムよりも優れていることを検証しました。

要約(オリジナル)

In intelligent Internet of Things (IoT) systems, edge servers within a network exchange information with their neighbors and collect data from sensors to complete delivered tasks. In this paper, we propose a multiplayer multi-armed bandit model for intelligent IoT systems to facilitate data collection and incorporate fairness considerations. In our model, we establish an effective communication protocol that helps servers cooperate with their neighbors. Then we design a distributed cooperative bandit algorithm, DC-ULCB, enabling servers to collaboratively select sensors to maximize data rates while maintaining fairness in their choices. We conduct an analysis of the reward regret and fairness regret of DC-ULCB, and prove that both regrets have logarithmic instance-dependent upper bounds. Additionally, through extensive simulations, we validate that DC-ULCB outperforms existing algorithms in maximizing reward and ensuring fairness.

arxiv情報

著者 Ziqun Chen,Kechao Cai,Jinbei Zhang,Zhigang Yu
発行日 2024-03-18 09:25:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DC, cs.LG パーマリンク