Safe Bayesian Optimization for the Control of High-Dimensional Embodied Systems

要約

動物やロボットにとって、動き方を学ぶことは主な目標であり、身体化されたシステムの制御ポリシーを最適化する際には、安全性の確保が重要となることがよくあります。
人間の制御やヒューマノイドの制御などの複雑なタスクの場合、高次元パラメータ空間により安全な最適化作業がさらに複雑になります。
現在の安全な探索アルゴリズムは非効率的であり、大規模な高次元入力空間では実行不可能になる可能性さえあります。
さらに、既存の高次元制約付き最適化手法は、探索プロセスにおける安全性を無視しています。
この論文では、確率的安全制約の下で高次元のサンプリング問題を処理するように設計された新しいアプローチである、局所楽観的探索を伴う高次元安全ベイジアン最適化 (HdSafeBO) を提案します。
目的関数を効率的かつ安全に最適化するための局所的な楽観的戦略を導入し、確率的な安全性の保証と累積的な安全性違反の限界を提供します。
HdSafeBO は、アイソメトリック埋め込みの使用を通じて、安全性の保証を維持しながら、数百次元から数千次元にわたる問題に対処します。
私たちの知る限り、HdSafeBO は、高い安全確率で高次元の筋骨格系の制御を最適化できる最初のアルゴリズムです。
また、神経刺激による人間の動作制御の安全なオンライン最適化における HdSafeBO の使用を通じて、HdSafeBO の実世界への適用性も実証します。

要約(オリジナル)

Learning to move is a primary goal for animals and robots, where ensuring safety is often important when optimizing control policies on the embodied systems. For complex tasks such as the control of human or humanoid control, the high-dimensional parameter space adds complexity to the safe optimization effort. Current safe exploration algorithms exhibit inefficiency and may even become infeasible with large high-dimensional input spaces. Furthermore, existing high-dimensional constrained optimization methods neglect safety in the search process. In this paper, we propose High-dimensional Safe Bayesian Optimization with local optimistic exploration (HdSafeBO), a novel approach designed to handle high-dimensional sampling problems under probabilistic safety constraints. We introduce a local optimistic strategy to efficiently and safely optimize the objective function, providing a probabilistic safety guarantee and a cumulative safety violation bound. Through the use of isometric embedding, HdSafeBO addresses problems ranging from a few hundred to several thousand dimensions while maintaining safety guarantees. To our knowledge, HdSafeBO is the first algorithm capable of optimizing the control of high-dimensional musculoskeletal systems with high safety probability. We also demonstrate the real-world applicability of HdSafeBO through its use in the safe online optimization of neural stimulation induced human motion control.

arxiv情報

著者 Yunyue Wei,Zeji Yi,Hongda Li,Saraswati Soedarmadji,Yanan Sui
発行日 2024-12-29 04:42:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク