RADIUM: Predicting and Repairing End-to-End Robot Failures using Gradient-Accelerated Sampling

要約

自律システムをセーフティクリティカルなアプリケーションに導入する前に、これらのシステムの安全性を理解し検証できなければならない。実環境でのテストにかかるリスクやコストが法外である場合に備えて、我々は、a) 自律システムが故障する可能性のある方法を予測し、b) システムの設計と制御ポリシーを自動的に調整して、それらの故障を先制的に軽減するための、シミュレーションベースのフレームワークを提案する。故障予測のための既存のツールは、高次元の環境パラメータを探索するのに苦労し、ループ内に視覚を持つシステムのエンドツーエンドのテストを効率的に扱うことができず、故障が発見された後、どのように故障を軽減するかについての指針をほとんど提供しない。我々は、近似ベイズ推論のレンズを通してこの問題にアプローチし、効率的な故障ケースの予測と修復のために微分可能なシミュレーションとレンダリングを使用します。微分可能なシミュレータが利用できない場合のために、我々のアルゴリズムの勾配なしバージョンを提供し、勾配ベース手法と勾配なし手法の間のトレードオフの理論的および経験的評価を含む。我々は、ロボット群の探索パターンの最適化、UAVフォーメーション制御、ロバストネットワーク制御など、様々なロボット工学と制御問題に我々のアプローチを適用する。最適化ベースの改竄手法と比較して、我々の手法はより多様で代表的な故障モードの集合を予測し、微分可能なシミュレーションを用いることで、勾配を用いない手法と比較して、最大10倍低いコストで、最大2倍少ない反復で収束する解が得られることを見出した。ハードウェア実験では、本手法を用いて制御ポリシーを修復すると、ロバスト性が5倍向上することがわかった。付属のコードとビデオはhttps://mit-realm.github.io/radium/。

要約(オリジナル)

Before autonomous systems can be deployed in safety-critical applications, we must be able to understand and verify the safety of these systems. For cases where the risk or cost of real-world testing is prohibitive, we propose a simulation-based framework for a) predicting ways in which an autonomous system is likely to fail and b) automatically adjusting the system’s design and control policy to preemptively mitigate those failures. Existing tools for failure prediction struggle to search over high-dimensional environmental parameters, cannot efficiently handle end-to-end testing for systems with vision in the loop, and provide little guidance on how to mitigate failures once they are discovered. We approach this problem through the lens of approximate Bayesian inference and use differentiable simulation and rendering for efficient failure case prediction and repair. For cases where a differentiable simulator is not available, we provide a gradient-free version of our algorithm, and we include a theoretical and empirical evaluation of the trade-offs between gradient-based and gradient-free methods. We apply our approach on a range of robotics and control problems, including optimizing search patterns for robot swarms, UAV formation control, and robust network control. Compared to optimization-based falsification methods, our method predicts a more diverse, representative set of failure modes, and we find that our use of differentiable simulation yields solutions that have up to 10x lower cost and requires up to 2x fewer iterations to converge relative to gradient-free techniques. In hardware experiments, we find that repairing control policies using our method leads to a 5x robustness improvement. Accompanying code and video can be found at https://mit-realm.github.io/radium/

arxiv情報

著者 Charles Dawson,Anjali Parashar,Chuchu Fan
発行日 2024-04-04 12:45:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク