要約
変形可能な物体の操作は、ロボット工学における長年の課題です。
既存のアプローチは特定の種類のオブジェクトに限定的に焦点を当てていることが多いですが、私たちは、豆、ロープ、布、液体など、さまざまな種類のオブジェクトを操作できる汎用アルゴリズムを模索しています。
。
。
。
重要な問題の 1 つは、オブジェクトの形状や操作のためのダイナミクスをキャプチャするのに十分な量の表現が適切でありながら、センサー データから効果的に取得できるほど単純であるということです。
具体的には、変形可能なオブジェクトを操作するための新しいアルゴリズムである Differentiable Particles (DiPac) を提案します。
DiPac は、変形可能なオブジェクトを粒子のセットとして表し、微分可能な粒子ダイナミクス シミュレーターを使用してロボットの操作を推論します。
最適な操作アクションを見つけるために、DiPac は学習、計画、および微分可能軌道ツリー最適化による軌道最適化を組み合わせます。
微分可能なダイナミクスは大きな利点を提供し、DiPac が (i) ダイナミクス パラメータを効率的に推定して、それによってシミュレーションと実数のギャップを狭め、(ii) サンプリングされた軌道に沿って勾配を逆伝播することによって最適なアクションを選択することを可能にします。
シミュレーションと実際のロボット実験の両方が有望な結果を示しています。
DiPac はさまざまな種類のオブジェクトを処理します。
計画と学習を組み合わせることで、DiPac は純粋なモデルベースの計画手法と純粋なデータ駆動型の学習手法の両方を上回ります。
さらに、DiPac は堅牢で力学の変化に適応するため、あるオブジェクトから異なる物理的特性を持つ別のオブジェクトへ (例: 硬いロッドから変形可能なロープへ) エキスパート ポリシーを転送できます。
要約(オリジナル)
Deformable object manipulation is a long-standing challenge in robotics. While existing approaches often focus narrowly on a specific type of object, we seek a general-purpose algorithm, capable of manipulating many different types of objects: beans, rope, cloth, liquid, . . . . One key difficulty is a suitable representation, rich enough to capture object shape, dynamics for manipulation and yet simple enough to be acquired effectively from sensor data. Specifically, we propose Differentiable Particles (DiPac), a new algorithm for deformable object manipulation. DiPac represents a deformable object as a set of particles and uses a differentiable particle dynamics simulator to reason about robot manipulation. To find the best manipulation action, DiPac combines learning, planning, and trajectory optimization through differentiable trajectory tree optimization. Differentiable dynamics provides significant benefits and enable DiPac to (i) estimate the dynamics parameters efficiently, thereby narrowing the sim-to-real gap, and (ii) choose the best action by backpropagating the gradient along sampled trajectories. Both simulation and real-robot experiments show promising results. DiPac handles a variety of object types. By combining planning and learning, DiPac outperforms both pure model-based planning methods and pure data-driven learning methods. In addition, DiPac is robust and adapts to changes in dynamics, thereby enabling the transfer of an expert policy from one object to another with different physical properties, e.g., from a rigid rod to a deformable rope.
arxiv情報
著者 | Siwei Chen,Yiqing Xu,Cunjun Yu,Linfeng Li,David Hsu |
発行日 | 2024-05-02 06:55:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google