Investigating the Impact of Action Representations in Policy Gradient Algorithms


強化学習~(RL) は、現実世界の複雑なタスクを解決する方法を学習するための多用途のフレームワークです。
ただし、RL アルゴリズムの学習パフォーマンスへの影響は、実際にはほとんど理解されていないことがよくあります。
さまざまな分析手法について説明し、RL におけるアクション表現の影響を調査するためのその有効性を評価します。
私たちの実験は、アクション表現が一般的な RL ベンチマーク タスクの学習パフォーマンスに大きな影響を与える可能性があることを示しています。
最後に、RL アルゴリズムの分析技術の未解決の課題について説明します。


Reinforcement learning~(RL) is a versatile framework for learning to solve complex real-world tasks. However, influences on the learning performance of RL algorithms are often poorly understood in practice. We discuss different analysis techniques and assess their effectiveness for investigating the impact of action representations in RL. Our experiments demonstrate that the action representation can significantly influence the learning performance on popular RL benchmark tasks. The analysis results indicate that some of the performance differences can be attributed to changes in the complexity of the optimization landscape. Finally, we discuss open challenges of analysis techniques for RL algorithms.


著者 Jan Schneider,Pierre Schumacher,Daniel Häufle,Bernhard Schölkopf,Dieter Büchler
発行日 2023-09-13 12:41:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク