Improving Wind Resistance Performance of Cascaded PID Controlled Quadcopters using Residual Reinforcement Learning

要約

クワッドコプターが目標位置から逸脱しないように位置を維持し、障害物との衝突を防止するためには、耐風制御が不可欠である。従来、クアッドコプターの制御には、シンプルでパラメータ調整が容易なカスケード型PIDコントローラが用いられてきた。しかし,風擾乱に弱く,クアッドコプタが目標位置から逸脱しやすいという問題がある.そこで本研究では、残差強化学習を用いたクワッドコプターの耐風制御を提案する。外乱を補正する残差のみを学習することで、カスケードPIDコントローラをクワッドコプターの基本コントローラとして使用し続けながら、風外乱に対する性能を向上させることができる。クアッドコプターの予期せぬ墜落や破壊を避けるため、本手法ではデータ収集と訓練に実際のハードウェアを必要としない。コントローラはシミュレータ上でのみトレーニングされ、余分な微調整プロセスなしに直接ターゲットハードウェアに適用される。風速13m/s以上の屋外での実験を含む様々な実験を通して、本アプローチの有効性を実証する。そのシンプルさにもかかわらず、我々のコントローラは、従来のカスケードPIDコントローラで制御されたクアッドコプターと比較して、位置偏差を約50%低減した。さらに、クアッドコプターの質量やプロペラの揚力係数が当初の学習時の50%から150%の間で変化しても、学習したコントローラはロバストであり、その性能を維持することができた。

要約(オリジナル)

Wind resistance control is an essential feature for quadcopters to maintain their position to avoid deviation from target position and prevent collisions with obstacles. Conventionally, cascaded PID controller is used for the control of quadcopters for its simplicity and ease of tuning its parameters. However, it is weak against wind disturbances and the quadcopter can easily deviate from target position. In this work, we propose a residual reinforcement learning based approach to build a wind resistance controller of a quadcopter. By learning only the residual that compensates the disturbance, we can continue using the cascaded PID controller as the base controller of the quadcopter but improve its performance against wind disturbances. To avoid unexpected crashes and destructions of quadcopters, our method does not require real hardware for data collection and training. The controller is trained only on a simulator and directly applied to the target hardware without extra finetuning process. We demonstrate the effectiveness of our approach through various experiments including an experiment in an outdoor scene with wind speed greater than 13 m/s. Despite its simplicity, our controller reduces the position deviation by approximately 50% compared to the quadcopter controlled with the conventional cascaded PID controller. Furthermore, trained controller is robust and preserves its performance even though the quadcopter’s mass and propeller’s lift coefficient is changed between 50% to 150% from original training time.

arxiv情報

著者 Yu Ishihara,Yuichi Hazama,Kousuke Suzuki,Jerry Jun Yokono,Kohtaro Sabe,Kenta Kawamoto
発行日 2023-08-03 09:29:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.RO パーマリンク