AirPilot: A PPO-based DRL Auto-Tuned Nonlinear PID Drone Controller for Robust Autonomous Flights

要約

ナビゲーションの精度、速度、安定性は、安全な UAV 飛行操縦と動的な環境での効果的な飛行ミッションの実行にとって非常に重要です。
さまざまな飛行ミッションには、エネルギー消費の最小化、正確な位置決めの達成、速度の最大化など、さまざまな目的がある場合があります。
さまざまな目的にその場で適応できるコントローラーは非常に価値があります。
比例積分微分コントローラーは、ドローン制御システムで最も一般的で広く使用されている制御アルゴリズムの 1 つですが、その線形制御アルゴリズムでは、動的な風の状態や複雑なドローン システムの非線形性を捉えることができません。
さまざまなミッションに合わせて PID ゲインを手動で調整するには時間がかかり、高度な専門知識が必要です。
この論文は、近接ポリシー最適化を使用した強化された PID ドローン コントローラーである非線形深層強化学習 (DRL) である AirPilot を紹介することにより、ドローンの飛行制御に革命を起こすことを目的としています。
AirPilot コントローラーは、従来の PID 制御のシンプルさと有効性を、DRL の適応性、学習機能、最適化の可能性と組み合わせています。
これにより、環境が動的で、ミッション固有のパフォーマンス要求が高い最新のドローン アプリケーションにより適しています。
私たちは、Gazebo シミュレーター内で DRL エージェントをトレーニングするために COEX Clover 自律型ドローンを採用し、その後、それを現実世界のラボ設定に実装しました。これは、DRL ベースのフライト コントローラーを実際の航空機に適用する最初の試みの 1 つとして、重要なマイルストーンとなります。
ドローン。
Airpilot は、ナビゲーション エラーを 82% 以上削減し、オーバーシュート、速度、整定時間を大幅に改善することができます。

要約(オリジナル)

Navigation precision, speed and stability are crucial for safe UAV flight maneuvers and effective flight mission executions in dynamic environments. Different flight missions may have varying objectives, such as minimizing energy consumption, achieving precise positioning, or maximizing speed. A controller that can adapt to different objectives on the fly is highly valuable. Proportional Integral Derivative controllers are one of the most popular and widely used control algorithms for drones control systems, but their linear control algorithm fails to capture the nonlinear nature of the dynamic wind conditions and complex drone system. Manually tuning the PID gains for various missions can be time-consuming and requires significant expertise. This paper aims to revolutionize drone flight control by presenting the AirPilot, a nonlinear Deep Reinforcement Learning (DRL) – enhanced PID drone controller using Proximal Policy Optimization. AirPilot controller combines the simplicity and effectiveness of traditional PID control with the adaptability, learning capability, and optimization potential of DRL. This makes it better suited for modern drone applications where the environment is dynamic, and mission-specific performance demands are high. We employed a COEX Clover autonomous drone for training the DRL agent within the Gazebo simulator and subsequently implemented it in a real-world lab setting, which marks a significant milestone as one of the first attempts to apply a DRL-based flight controller on an actual drone. Airpilot is capable of reducing the navigation error by more than 82% and improving overshoot, speed and settling time significantly.

arxiv情報

著者 Junyang Zhang,Cristian Emanuel Ocampo Rivera,Kyle Tyni,Steven Nguyen,Ulices Santa Cruz Leal,Yasser Shoukry
発行日 2024-08-16 07:08:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク