Task-Based Design and Policy Co-Optimization for Tendon-driven Underactuated Kinematic Chains

要約

マニピュレータの作動が不十分なため、かさばるモーターの数が減り、それによってコンパクトで機械的に堅牢な設計が可能になります。
ただし、ジョイントよりもアクチュエータが少ないということは、マニピュレータがジョイント空間内の特定のマニホールドにのみアクセスできることを意味します。これは、特定のハードウェア構成に特有であり、低次元および/または不連続になる可能性があります。
したがって、このクラスのメカニズムに適切なハードウェア パラメーターのセットを決定することは、従来のタスクベースの協調最適化手法であっても困難です。
この論文では、私たちの目標は、作動が不十分な腱駆動のマニピュレーターに対して、タスクベースの設計とポリシーの協調最適化手法を実装することです。
まず、作動が不十分な腱駆動伝達の一般モデルを定式化します。
次に、このモデルを使用して、強化学習を使用して 3 リンク、2 アクチュエータの運動連鎖を共同最適化します。
実際の到達実験により、最適化された腱伝達および制御ポリシーを物理ハードウェアに確実に転送できることを実証します。

要約(オリジナル)

Underactuated manipulators reduce the number of bulky motors, thereby enabling compact and mechanically robust designs. However, fewer actuators than joints means that the manipulator can only access a specific manifold within the joint space, which is particular to a given hardware configuration and can be low-dimensional and/or discontinuous. Determining an appropriate set of hardware parameters for this class of mechanisms, therefore, is difficult – even for traditional task-based co-optimization methods. In this paper, our goal is to implement a task-based design and policy co-optimization method for underactuated, tendon-driven manipulators. We first formulate a general model for an underactuated, tendon-driven transmission. We then use this model to co-optimize a three-link, two-actuator kinematic chain using reinforcement learning. We demonstrate that our optimized tendon transmission and control policy can be transferred reliably to physical hardware with real-world reaching experiments.

arxiv情報

著者 Sharfin Islam,Zhanpeng He,Matei Ciocarlie
発行日 2024-05-23 13:43:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク