Reinforcement Learning-Based Control of CrazyFlie 2.X Quadrotor

要約

プロジェクトの目的は、PID などの古典的な制御アルゴリズムと現代の強化学習アルゴリズムの間の相乗効果を調査し、CrazyFlie 2.X クアローターを制御するための実用的な制御メカニズムを考案することです。
主な目的は、強化学習戦略を使用して PID 調整を実行することです。
2 番目の目的は、最初のタスクで得た学習を活用して、灯台測位システムと統合してナビゲーションの制御を実装することです。
ナビゲーションには 2 つのアプローチが考慮されています。1 つは有限の事前定義モーション プリミティブを使用した深層 Q ラーニングを使用した離散ナビゲーション問題、もう 1 つは連続ナビゲーション アプローチのための深層強化学習です。
RL トレーニングのシミュレーションは、強化学習のためのオープンソースのジムベースの環境である Gym-pybullet-drones で実行され、RL の実装は、stable-baselines3 によって提供されます。

要約(オリジナル)

The objective of the project is to explore synergies between classical control algorithms such as PID and contemporary reinforcement learning algorithms to come up with a pragmatic control mechanism to control the CrazyFlie 2.X quadrotor. The primary objective would be performing PID tuning using reinforcement learning strategies. The secondary objective is to leverage the learnings from the first task to implement control for navigation by integrating with the lighthouse positioning system. Two approaches are considered for navigation, a discrete navigation problem using Deep Q-Learning with finite predefined motion primitives, and deep reinforcement learning for a continuous navigation approach. Simulations for RL training will be performed on gym-pybullet-drones, an open-source gym-based environment for reinforcement learning, and the RL implementations are provided by stable-baselines3

arxiv情報

著者 Arshad Javeed,Valentín López Jiménez,Johan Grönqvist
発行日 2023-06-06 18:29:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク