Constraint-Guided Online Data Selection for Scalable Data-Driven Safety Filters in Uncertain Robotic Systems

要約

複雑でモデル化が困難なタスクで自律ロボットの使用が拡大するにつれて、不確実な状況での安全性と安定性を保証できる堅牢なデータ駆動型制御手法への需要が高まっています。
ただし、これらの手法を実際に実装すると、システムの複雑さとともにデータ ポイントの量が増大し、高品質のトレーニング データに大きく依存するため、スケーラビリティの問題に直面することがよくあります。
これらの課題に対応して、この研究では、データ駆動型安全フィルターを実装するための最も有益なデータポイントを効率的に特定し、そこから推論する、スケーラブルなデータ駆動型コントローラーを紹介します。
私たちのアプローチは、モデルベースの証明書関数ベースの手法とガウス過程 (GP) 回帰の統合に基づいており、データセットのサイズに応じて時間の複雑さを 2 次から線形に軽減する新しいオンライン データ選択アルゴリズムによって強化されています。
実際の成功したカートポールスイングアップ実験と5リンク二足歩行ロボットの模擬移動から収集された経験的証拠は、私たちのアプローチの有効性を実証しています。
私たちの調査結果は、重要なデータポイントを戦略的に選択する効率的なオンラインデータ選択アルゴリズムが、複雑なロボットシステムにおけるデータ駆動型認証フィルターの実用性と効率を向上させ、ノンパラメトリック学習ベースの制御方法に固有のスケーラビリティの懸念を大幅に軽減することを明らかにしました。

要約(オリジナル)

As the use of autonomous robots expands in tasks that are complex and challenging to model, the demand for robust data-driven control methods that can certify safety and stability in uncertain conditions is increasing. However, the practical implementation of these methods often faces scalability issues due to the growing amount of data points with system complexity, and a significant reliance on high-quality training data. In response to these challenges, this study presents a scalable data-driven controller that efficiently identifies and infers from the most informative data points for implementing data-driven safety filters. Our approach is grounded in the integration of a model-based certificate function-based method and Gaussian Process (GP) regression, reinforced by a novel online data selection algorithm that reduces time complexity from quadratic to linear relative to dataset size. Empirical evidence, gathered from successful real-world cart-pole swing-up experiments and simulated locomotion of a five-link bipedal robot, demonstrates the efficacy of our approach. Our findings reveal that our efficient online data selection algorithm, which strategically selects key data points, enhances the practicality and efficiency of data-driven certifying filters in complex robotic systems, significantly mitigating scalability concerns inherent in nonparametric learning-based control methods.

arxiv情報

著者 Jason J. Choi,Fernando Castañeda,Wonsuhk Jung,Bike Zhang,Claire J. Tomlin,Koushil Sreenath
発行日 2024-09-27 06:13:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク