要約
長い視野にわたる大きなオブジェクト (倉庫内のカートなど) の操作は、展開可能なロボット システムにとって不可欠なスキルです。
大きな物体には、物体を牽引して同時に操作、ナビゲーション、移動を行うモバイル操作が必要です。
現実世界の多くの状況では、オフィスチェア (回転ベースと 5 つのキャスターホイール付き) と地面の相互作用など、オブジェクトのダイナミクスは非常に複雑です。
ダイナミクスが部分的に不明な長距離ロボット操作問題に対する階層アルゴリズムを提案します。
拡散ベースの動作クローニングは、ダイナミクスが未知の短距離問題に対して非常に効果的であることが観察されたため、この問題を、ウェイポイント シーケンスを生成する抽象的な高レベルの障害物認識運動計画問題に分解します。
ウェイポイントを順番に達成するために、短地平線の相対運動拡散ポリシーを使用します。
私たちは、オフィスの椅子を押したり引いたりする必要がある Spot ロボットでモバイル操作ポリシーをトレーニングします。
私たちの階層的操作ポリシーは、長い水平線のデモンストレーションや、しっかりと取り付けられたオブジェクトを想定した動作計画で訓練された拡散ポリシーと比較して、特に水平線が長くなった場合に一貫して優れたパフォーマンスを発揮します (10 回の実行中、成功率は 8 (それぞれ 0 と 5))。
)。
重要なのは、私たちが学習したポリシーは、さらなるトレーニングなしで、より多くの摩擦を引き起こす新しいレイアウト、グリップ、椅子、床材に一般化され、他の複雑なモバイル操作の問題にも有望であることを示しています。
プロジェクトページ: https://yravan.github.io/plannerownedpolicy/
要約(オリジナル)
Manipulation of large objects over long horizons (such as carts in a warehouse) is an essential skill for deployable robotic systems. Large objects require mobile manipulation which involves simultaneous manipulation, navigation, and movement with the object in tow. In many real-world situations, object dynamics are incredibly complex, such as the interaction of an office chair (with a rotating base and five caster wheels) and the ground. We present a hierarchical algorithm for long-horizon robot manipulation problems in which the dynamics are partially unknown. We observe that diffusion-based behavior cloning is highly effective for short-horizon problems with unknown dynamics, so we decompose the problem into an abstract high-level, obstacle-aware motion-planning problem that produces a waypoint sequence. We use a short-horizon, relative-motion diffusion policy to achieve the waypoints in sequence. We train mobile manipulation policies on a Spot robot that has to push and pull an office chair. Our hierarchical manipulation policy performs consistently better, especially when the horizon increases, compared to a diffusion policy trained on long-horizon demonstrations or motion planning assuming a rigidly-attached object (success rate of 8 (versus 0 and 5 respectively) out of 10 runs). Importantly, our learned policy generalizes to new layouts, grasps, chairs, and flooring that induces more friction, without any further training, showing promise for other complex mobile manipulation problems. Project Page: https://yravan.github.io/plannerorderedpolicy/
arxiv情報
著者 |
Yajvan Ravan,Zhutian Yang,Tao Chen,Tomás Lozano-Pérez,Leslie Pack Kaelbling |
発行日 |
2024-10-09 14:12:28+00:00 |
arxivサイト |
arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google