Safe Guaranteed Exploration for Non-linear Systems

要約

事前に未知の制約がある環境を安全に探索することは、ロボットの自律性を制限する根本的な課題です。
安全は最も重要ですが、自律タスクを確実に完了するには、十分な探索を保証することも重要です。
これらの課題に対処するために、私たちは、最適制御を使用した新しい安全保証探査フレームワークを提案します。これにより、これまでにない結果が得られます。つまり、任意の高い確率で安全であることが証明されながら、有限時間のサンプル複雑さの限界を持つ非線形システムの保証探査です。

このフレームワークは一般的であり、複雑な非線形ダイナミクスや未知の領域を伴う多くの実世界のシナリオに適用できます。
このフレームワークに基づいて、モデル予測制御を使用した効率的なアルゴリズムである SageMPC、SAfe 保証付き探索を提案します。
SageMPC は、i) リプシッツ限界の活用、ii) 目標指向探索、および iii) 後退地平線スタイルの再計画という 3 つの手法を組み込むことで効率を向上させます。すべて、フレームワークの望ましいサンプルの複雑さ、安全性、探索の保証を維持します。
最後に、SageMPC と自動車モデルを使用して、挑戦的な未知の環境における安全で効率的な探索を実証します。

要約(オリジナル)

Safely exploring environments with a-priori unknown constraints is a fundamental challenge that restricts the autonomy of robots. While safety is paramount, guarantees on sufficient exploration are also crucial for ensuring autonomous task completion. To address these challenges, we propose a novel safe guaranteed exploration framework using optimal control, which achieves first-of-its-kind results: guaranteed exploration for non-linear systems with finite time sample complexity bounds, while being provably safe with arbitrarily high probability. The framework is general and applicable to many real-world scenarios with complex non-linear dynamics and unknown domains. Based on this framework we propose an efficient algorithm, SageMPC, SAfe Guaranteed Exploration using Model Predictive Control. SageMPC improves efficiency by incorporating three techniques: i) exploiting a Lipschitz bound, ii) goal-directed exploration, and iii) receding horizon style re-planning, all while maintaining the desired sample complexity, safety and exploration guarantees of the framework. Lastly, we demonstrate safe efficient exploration in challenging unknown environments using SageMPC with a car model.

arxiv情報

著者 Manish Prajapat,Johannes Köhler,Matteo Turchetta,Andreas Krause,Melanie N. Zeilinger
発行日 2024-02-09 17:26:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY, math.OC パーマリンク