要約
操作における固有のロバスト性は生物学的システムに広く普及しており、現実世界の不確実性と外乱によりロボット操作システムにとっては重要です。
この堅牢性は、堅牢な制御ポリシーだけでなく、エンドエフェクターの設計特性にも依存します。
このペーパーでは、堅牢な操作を実現するためのツールと制御ポリシーを共同設計するための 2 レベルの最適化アプローチを紹介します。
このアプローチでは、下位レベルの制御ポリシー学習には強化学習が、上位レベルの設計最適化にはマルチタスク ベイズ最適化が採用されています。
以前のアプローチとは異なり、ケージベースのロバスト性メトリクスを両方のレベルに組み込んで、外乱や環境変動に対する操作のロバスト性を確保します。
私たちの方法は、4つの非把握的操作環境で評価され、外乱や環境変化の下でのタスク成功率の向上が実証されました。
フレームワークの実際的な有効性を検証するために、実際の実験も行われます。
要約(オリジナル)
Inherent robustness in manipulation is prevalent in biological systems and critical for robotic manipulation systems due to real-world uncertainties and disturbances. This robustness relies not only on robust control policies but also on the design characteristics of the end-effectors. This paper introduces a bi-level optimization approach to co-designing tools and control policies to achieve robust manipulation. The approach employs reinforcement learning for lower-level control policy learning and multi-task Bayesian optimization for upper-level design optimization. Diverging from prior approaches, we incorporate caging-based robustness metrics into both levels, ensuring manipulation robustness against disturbances and environmental variations. Our method is evaluated in four non-prehensile manipulation environments, demonstrating improvements in task success rate under disturbances and environment changes. A real-world experiment is also conducted to validate the framework’s practical effectiveness.
arxiv情報
著者 | Yifei Dong,Shaohang Han,Xianyi Cheng,Werner Friedl,Rafael I. Cabral Muchacho,Máximo A. Roa,Jana Tumova,Florian T. Pokorny |
発行日 | 2024-09-17 12:06:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google