Safe Reinforcement Learning Filter for Multicopter Collision-Free Tracking under disturbances

要約

本稿では、入力外乱によるマルチコプタの無衝突軌道追跡を実現するための安全強化学習フィルタ(SRLF)を提案する。
追跡中の未知の外乱との衝突を回避するために、新しいロバスト コントロール バリア関数 (RCBF) とその解析技術が導入されています。
システム状態が安全なセット内に確実に収まるように、RCBF ゲインは制御動作で設計されています。
安全でない強化学習 (RL) 制御入力を安全なものに変換するために安全フィルターが導入され、安全性の制約を明示的に考慮せずに RL トレーニングを続行できるようになります。
SRLF は、RCBF の前方不変性と入力飽和制約を組み込んだ二次計画法 (QP) 問題を解くことにより、厳密に保証された安全な制御動作を取得します。
マルチコプターでのシミュレーションと現実世界の実験の両方で、入力外乱や飽和下で衝突のない追跡を達成する際の SRLF の有効性と優れたパフォーマンスが実証されています。

要約(オリジナル)

This paper proposes a safe reinforcement learning filter (SRLF) to realize multicopter collision-free trajectory tracking with input disturbance. A novel robust control barrier function (RCBF) with its analysis techniques is introduced to avoid collisions with unknown disturbances during tracking. To ensure the system state remains within the safe set, the RCBF gain is designed in control action. A safety filter is introduced to transform unsafe reinforcement learning (RL) control inputs into safe ones, allowing RL training to proceed without explicitly considering safety constraints. The SRLF obtains rigorous guaranteed safe control action by solving a quadratic programming (QP) problem that incorporates forward invariance of RCBF and input saturation constraints. Both simulation and real-world experiments on multicopters demonstrate the effectiveness and excellent performance of SRLF in achieving collision-free tracking under input disturbances and saturation.

arxiv情報

著者 Qihan Qi,Xinsong Yang,Gang Xia
発行日 2024-10-09 13:16:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク