Autonomous Blimp Control via H-infinity Robust Deep Residual Reinforcement Learning

要約

優れたエネルギー効率により、飛行船はクワッドコプターの代わりに長時間の空中作業を行うことができます。
ただし、複雑なダイナミクス、モデリング エラー、外乱を処理する飛行船のコントローラーを設計することは、未解決の課題のままです。
最近の研究では、強化学習 (RL) と PID コントローラーを組み合わせてこの課題に対処し、実世界の実験でその有効性を実証しています。
現在の作業では、H 無限ロバスト コントローラーを使用してそれを構築し、安定余裕を拡大して RL エージェントのパフォーマンスを向上させます。
さまざまな混合方法の経験的分析により、結果として得られる H-infinity-RL コントローラーが以前の PID-RL の組み合わせよりも優れており、強力な推力ベクトル化を含むより複雑なタスクを処理できることが明らかになりました。
https://github.com/robot-perception-group/robust_deep_residual_blimp でコードをオープンソースとして提供しています。

要約(オリジナル)

Due to their superior energy efficiency, blimps may replace quadcopters for long-duration aerial tasks. However, designing a controller for blimps to handle complex dynamics, modeling errors, and disturbances remains an unsolved challenge. One recent work combines reinforcement learning (RL) and a PID controller to address this challenge and demonstrates its effectiveness in real-world experiments. In the current work, we build on that using an H-infinity robust controller to expand the stability margin and improve the RL agent’s performance. Empirical analysis of different mixing methods reveals that the resulting H-infinity-RL controller outperforms the prior PID-RL combination and can handle more complex tasks involving intensive thrust vectoring. We provide our code as open-source at https://github.com/robot-perception-group/robust_deep_residual_blimp.

arxiv情報

著者 Yang Zuo,Yu Tang Liu,Aamir Ahmad
発行日 2023-03-24 11:36:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク