Tuning Legged Locomotion Controllers via Safe Bayesian Optimization

要約

この論文では、脚式ロボット ハードウェア プラットフォームにおけるモデルベースのコントローラーの展開を合理化するためのデータ駆動型戦略を紹介します。
私たちのアプローチは、モデルフリーの安全な学習アルゴリズムを活用して制御ゲインの調整を自動化し、制御の定式化で使用される単純化されたモデルと実際のシステムの間の不一致に対処します。
この方法は、おそらく安全な領域内でパラメータをサンプル効率的に最適化することにより、ロボットとの危険な相互作用のリスクを大幅に軽減します。
さらに、さまざまな歩行パラメータをコンテキストとして組み込むアプローチの適用可能性を拡張し、さまざまな歩行パターンに合わせてモーション コントローラーを調整できる、安全でサンプル効率の高い探索アルゴリズムを実現します。
私たちはシミュレーションとハードウェア実験を通じてこの方法を検証し、アルゴリズムが複数の歩行を安全に行うためにモデルベースのモーション コントローラーを調整する際に優れたパフォーマンスを獲得することを実証します。

要約(オリジナル)

This paper presents a data-driven strategy to streamline the deployment of model-based controllers in legged robotic hardware platforms. Our approach leverages a model-free safe learning algorithm to automate the tuning of control gains, addressing the mismatch between the simplified model used in the control formulation and the real system. This method substantially mitigates the risk of hazardous interactions with the robot by sample-efficiently optimizing parameters within a probably safe region. Additionally, we extend the applicability of our approach to incorporate the different gait parameters as contexts, leading to a safe, sample-efficient exploration algorithm capable of tuning a motion controller for diverse gait patterns. We validate our method through simulation and hardware experiments, where we demonstrate that the algorithm obtains superior performance on tuning a model-based motion controller for multiple gaits safely.

arxiv情報

著者 Daniel Widmer,Dongho Kang,Bhavya Sukhija,Jonas Hübotter,Andreas Krause,Stelian Coros
発行日 2023-10-26 03:54:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク