One Filter to Deploy Them All: Robust Safety for Quadrupedal Navigation in Unknown Environments

要約

脚式ロボットの学習ベースの手法の人気が急速に高まっているため、さまざまなコントローラーや環境にわたって効率的に安全性を保証できることが重要です。
既存の作品は、システムの安全性を確保するために環境と安全性の制約に関する先験的な知識に依存しているか、または特定の移動ポリシーの保証を提供しています。
これらの制限に対処するために、観測条件付き到達可能性ベース (OCR) 安全フィルター フレームワークを提案します。
私たちの重要なアイデアは、新しい故障領域と展開時の動的不確実性に対する最適な制御理論的安全値関数を予測する OCR 値ネットワーク (OCR-VN) を使用することです。
具体的には、OCR-VN は 2 つの主要なコンポーネントを通じて迅速な安全適応を促進します。1 つは新しい障害物を考慮して安全な領域を動的に構築できる LiDAR ベースの入力、もう 1 つは野生環境での力学的不確実性を考慮する外乱推定モジュールです。
予測安全値関数は、安全性を維持するために必要な場合に公称四足コントローラーをオーバーライドする適応型安全フィルターを構築するために使用されます。
Unitree Go1 四足歩行器でのシミュレーション研究とハードウェア実験を通じて、提案されたフレームワークが広範囲の階層的四足歩行コントローラーを自動的に保護でき、新しい環境に適応し、コントローラーや環境に事前にアクセスしなくてもモデル化されていないダイナミクスに対して堅牢であることを実証します。
したがって、「1 つのフィルターですべてを展開」ということになります。
実験ビデオはプロジェクトの Web サイトでご覧いただけます。

要約(オリジナル)

As learning-based methods for legged robots rapidly grow in popularity, it is important that we can provide safety assurances efficiently across different controllers and environments. Existing works either rely on a priori knowledge of the environment and safety constraints to ensure system safety or provide assurances for a specific locomotion policy. To address these limitations, we propose an observation-conditioned reachability-based (OCR) safety-filter framework. Our key idea is to use an OCR value network (OCR-VN) that predicts the optimal control-theoretic safety value function for new failure regions and dynamic uncertainty during deployment time. Specifically, the OCR-VN facilitates rapid safety adaptation through two key components: a LiDAR-based input that allows the dynamic construction of safe regions in light of new obstacles and a disturbance estimation module that accounts for dynamics uncertainty in the wild. The predicted safety value function is used to construct an adaptive safety filter that overrides the nominal quadruped controller when necessary to maintain safety. Through simulation studies and hardware experiments on a Unitree Go1 quadruped, we demonstrate that the proposed framework can automatically safeguard a wide range of hierarchical quadruped controllers, adapts to novel environments, and is robust to unmodeled dynamics without a priori access to the controllers or environments – hence, ‘One Filter to Deploy Them All’. The experiment videos can be found on the project website.

arxiv情報

著者 Albert Lin,Shuang Peng,Somil Bansal
発行日 2024-12-13 09:21:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY パーマリンク