Multi-Agent Reinforcement Learning with Common Policy for Antenna Tilt Optimization


この論文では、最適化対象のセルと周囲のセルの両方のパフォーマンスに影響を与えるセル パラメータを調整することにより、ワイヤレス ネットワークを最適化する方法を紹介します。
このフェーズでは、静的ネットワーク シミュレーターからのフィードバックを使用し、さまざまなシナリオを考慮して、初期ポリシーが取得されます。
最後に、エージェントは小さな増分変更を提案することでテスト ネットワークのセル パラメータをインテリジェントに調整し、ネットワークを最適な構成に向けてゆっくりと導きます。
結果は、提案されたアプローチが、リモート アンテナのチルト最適化に適用された場合に、エキスパート システム ベースの方法によってすでに提供されているパフォーマンス ゲインを大幅に改善する方法を示しています。


This paper presents a method for optimizing wireless networks by adjusting cell parameters that affect both the performance of the cell being optimized and the surrounding cells. The method uses multiple reinforcement learning agents that share a common policy and take into account information from neighboring cells to determine the state and reward. In order to avoid impairing network performance during the initial stages of learning, agents are pre-trained in an earlier phase of offline learning. During this phase, an initial policy is obtained using feedback from a static network simulator and considering a wide variety of scenarios. Finally, agents can intelligently tune the cell parameters of a test network by suggesting small incremental changes, slowly guiding the network toward an optimal configuration. The agents propose optimal changes using the experience gained with the simulator in the pre-training phase, but they can also continue to learn from current network readings after each change. The results show how the proposed approach significantly improves the performance gains already provided by expert system-based methods when applied to remote antenna tilt optimization. The significant gains of this approach have truly been observed when compared with a similar method in which the state and reward do not incorporate information from neighboring cells.


著者 Adriano Mendo,Jose Outes-Carnero,Yak Ng-Molina,Juan Ramiro-Moreno
発行日 2023-05-24 15:24:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG, cs.MA, cs.SY, eess.SY パーマリンク