要約
現実世界の脚のある移動システムは、さまざまなシナリオの俊敏性と安全性を調整する必要があることがよくあります。
さらに、基礎となるダイナミクスはしばしば不明で時間変動(例えば、ペイロード、摩擦)です。
この論文では、以前の作業のアジャイルが安全(ABS)(HE等)のパイプラインに基づいたBAS(適応性と安全性の橋渡し)を紹介し、不確実性のある動的環境でも適応的な安全性を提供するように設計されています。
BASには、障害物を迅速に回避するためのアジャイルポリシーと、衝突を防ぐための回復ポリシー、アジャイルポリシーで同時に訓練された物理的パラメーター推定器、およびポリシースイッチを管理する学習制御理論RA(Reach-Avoid)バリューネットワークが含まれます。
また、アジャイルポリシーとRAネットワークは両方とも、それらを適応的にするための物理パラメーターを条件としています。
分布シフトの問題を軽減するために、さらに、推定器がその堅牢性と精度を高めるために、ポリティ上の微調整段階を導入します。
シミュレーション結果は、BASが平均して高速を維持しながら、動的環境でベースラインよりも50%優れた安全性を達成することを示しています。
実際の実験では、BASは、物理学が不明な複雑な環境でその能力を示しています(たとえば、未知の摩擦がある滑りやすい床、最大8kgまでのペイロード)。ベースラインには適応性がなく、衝突につながります。
劣化した敏ility性。
その結果、BASは速度が19.8%増加し、現実の世界でABSの2.36倍低い衝突率を獲得します。
ビデオ:https://adaptive-safe-locomotion.github.io。
要約(オリジナル)
Real-world legged locomotion systems often need to reconcile agility and safety for different scenarios. Moreover, the underlying dynamics are often unknown and time-variant (e.g., payload, friction). In this paper, we introduce BAS (Bridging Adaptivity and Safety), which builds upon the pipeline of prior work Agile But Safe (ABS)(He et al.) and is designed to provide adaptive safety even in dynamic environments with uncertainties. BAS involves an agile policy to avoid obstacles rapidly and a recovery policy to prevent collisions, a physical parameter estimator that is concurrently trained with agile policy, and a learned control-theoretic RA (reach-avoid) value network that governs the policy switch. Also, the agile policy and RA network are both conditioned on physical parameters to make them adaptive. To mitigate the distribution shift issue, we further introduce an on-policy fine-tuning phase for the estimator to enhance its robustness and accuracy. The simulation results show that BAS achieves 50% better safety than baselines in dynamic environments while maintaining a higher speed on average. In real-world experiments, BAS shows its capability in complex environments with unknown physics (e.g., slippery floors with unknown frictions, unknown payloads up to 8kg), while baselines lack adaptivity, leading to collisions or. degraded agility. As a result, BAS achieves a 19.8% increase in speed and gets a 2.36 times lower collision rate than ABS in the real world. Videos: https://adaptive-safe-locomotion.github.io.
arxiv情報
著者 | Yichao Zhong,Chong Zhang,Tairan He,Guanya Shi |
発行日 | 2025-02-19 14:13:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google