ハードウェアがますます複雑になるにつれ、衛星トランスポンダ上でリンク (接続) を効率的に構成することが課題の 1 つとなります。
このような最適化問題は、シミュレーテッド アニーリングなどのメタヒューリスティック手法を使用して近似できますが、最近の研究結果では、強化学習が最適化手法と同等、またはそれ以上のパフォーマンスを達成できることも示しています。
この環境では、強化学習アルゴリズム PPO のパフォーマンスが 2 つの実験でメタヒューリスティック シミュレーテッド アニーリングと比較されました。
結果は、この静的問題に対しては、シミュレーテッド アニーリングが PPO アルゴリズムよりも優れた結果をもたらすことを示していますが、この研究は、最適化問題に対する強化学習の可能性も強調しています。
Satellite communication is a key technology in our modern connected world. With increasingly complex hardware, one challenge is to efficiently configure links (connections) on a satellite transponder. Planning an optimal link configuration is extremely complex and depends on many parameters and metrics. The optimal use of the limited resources, bandwidth and power of the transponder is crucial. Such an optimization problem can be approximated using metaheuristic methods such as simulated annealing, but recent research results also show that reinforcement learning can achieve comparable or even better performance in optimization methods. However, there have not yet been any studies on link configuration on satellite transponders. In order to close this research gap, a transponder environment was developed as part of this work. For this environment, the performance of the reinforcement learning algorithm PPO was compared with the metaheuristic simulated annealing in two experiments. The results show that Simulated Annealing delivers better results for this static problem than the PPO algorithm, however, the research in turn also underlines the potential of reinforcement learning for optimization problems.
著者 | Tobias Rohe,Michael Kölle,Jan Matheis,Rüdiger Höpfl,Leo Sünkel,Claudia Linnhoff-Popien |
発行日 | 2025-01-14 16:04:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google