要約
現実世界の脚式移動システムでは、多くの場合、さまざまなシナリオに合わせて敏捷性と安全性を両立させる必要があります。
さらに、基礎となる力学は不明であり、時間によって変化することがよくあります (ペイロード、摩擦など)。
この論文では、以前の研究である Agile But Safe (ABS) (He et al.) のパイプラインに基づいて構築され、不確実性のある動的環境でも適応安全性を提供するように設計された BAS (Bridging Adaptivity and Safety) を紹介します。
BAS には、障害物を迅速に回避するためのアジャイル ポリシーと衝突を防ぐための回復ポリシー、アジャイル ポリシーと同時にトレーニングされる物理パラメータ推定器、およびポリシーの切り替えを制御する学習された制御理論的な RA (リーチ回避) 値ネットワークが含まれます。
また、アジャイル ポリシーと RA ネットワークは両方とも、適応性を持たせるために物理パラメータに基づいて条件付けされます。
分布シフトの問題を軽減するために、推定器の堅牢性と精度を強化するためのポリシーに基づく微調整フェーズをさらに導入します。
シミュレーション結果は、BAS が平均してより高い速度を維持しながら、動的環境においてベースラインよりも 50% 優れた安全性を達成することを示しています。
実際の実験では、BAS は物理学が未知の複雑な環境 (例: 摩擦が未知の滑りやすい床、最大 8kg までの未知の積載量) での能力を示しますが、ベースラインでは適応性が欠如しており、衝突や衝突が発生します。
敏捷性の低下。
その結果、BAS は現実世界の ABS に比べて 19.8% の速度向上を達成し、衝突率は 2.36 倍低くなります。
ビデオ: https://adaptive-safe-locomotion.github.io
要約(オリジナル)
Real-world legged locomotion systems often need to reconcile agility and safety for different scenarios. Moreover, the underlying dynamics are often unknown and time-variant (e.g., payload, friction). In this paper, we introduce BAS (Bridging Adaptivity and Safety), which builds upon the pipeline of prior work Agile But Safe (ABS)(He et al.) and is designed to provide adaptive safety even in dynamic environments with uncertainties. BAS involves an agile policy to avoid obstacles rapidly and a recovery policy to prevent collisions, a physical parameter estimator that is concurrently trained with agile policy, and a learned control-theoretic RA (reach-avoid) value network that governs the policy switch. Also, the agile policy and RA network are both conditioned on physical parameters to make them adaptive. To mitigate the distribution shift issue, we further introduce an on-policy fine-tuning phase for the estimator to enhance its robustness and accuracy. The simulation results show that BAS achieves 50% better safety than baselines in dynamic environments while maintaining a higher speed on average. In real-world experiments, BAS shows its capability in complex environments with unknown physics (e.g., slippery floors with unknown frictions, unknown payloads up to 8kg), while baselines lack adaptivity, leading to collisions or. degraded agility. As a result, BAS achieves a 19.8% increase in speed and gets a 2.36 times lower collision rate than ABS in the real world. Videos: https://adaptive-safe-locomotion.github.io.
arxiv情報
著者 | Yichao Zhong,Chong Zhang,Tairan He,Guanya Shi |
発行日 | 2025-01-08 04:54:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google