FLEX: A Framework for Learning Robot-Agnostic Force-based Skills Involving Sustained Contact Object Manipulation

要約

オブジェクトを効率的に操作すること、特に持続的な接触(プッシュ、スライドなど)および明確な部品(引き出し、ドアなど)を含むオブジェクトを操作することは、重大な課題を提示します。
ロボット中心の強化学習(RL)、模倣学習、ハイブリッド技術などの従来の方法には、大規模なトレーニングが必要であり、さまざまなオブジェクトやロボットプラットフォーム全体で一般化するのに苦労します。
オブジェクトからロボットを切り離し、力空間でオブジェクト中心の操作ポリシーを学習するための新しいフレームワークを提案します。
オブジェクトの選択された領域に力を直接適用することにより、私たちの方法はアクション空間を簡素化し、不必要な探索を減らし、シミュレーションオーバーヘッドを減らします。
このアプローチは、代表的なオブジェクトの小さなセットでシミュレーションでトレーニングされ、ジョイント構成などのオブジェクトのダイナミクスをキャプチャし、ポリシーが新しい目に見えないオブジェクトに効果的に一般化できるようにします。
これらのポリシーをロボット固有のダイナミクスから切り離すことで、再トレーニングなしで異なるロボットプラットフォーム(Kinova、Panda、UR5など)に直接転送できます。
私たちの評価は、この方法がベースラインを大幅に上回ることを示しており、他の最先端の方法と比較して、トレーニング効率を数桁改善することを実現しています。
さらに、空間で動作すると、多様なロボットプラットフォームとオブジェクトタイプ全体のポリシーの移転性が向上します。
さらに、実際のロボット設定でメソッドの適用性を紹介します。
補足資料やビデオについては、https://tufts-ai-robotics-group.github.io/flex/をご覧ください。

要約(オリジナル)

Learning to manipulate objects efficiently, particularly those involving sustained contact (e.g., pushing, sliding) and articulated parts (e.g., drawers, doors), presents significant challenges. Traditional methods, such as robot-centric reinforcement learning (RL), imitation learning, and hybrid techniques, require massive training and often struggle to generalize across different objects and robot platforms. We propose a novel framework for learning object-centric manipulation policies in force space, decoupling the robot from the object. By directly applying forces to selected regions of the object, our method simplifies the action space, reduces unnecessary exploration, and decreases simulation overhead. This approach, trained in simulation on a small set of representative objects, captures object dynamics — such as joint configurations — allowing policies to generalize effectively to new, unseen objects. Decoupling these policies from robot-specific dynamics enables direct transfer to different robotic platforms (e.g., Kinova, Panda, UR5) without retraining. Our evaluations demonstrate that the method significantly outperforms baselines, achieving over an order of magnitude improvement in training efficiency compared to other state-of-the-art methods. Additionally, operating in force space enhances policy transferability across diverse robot platforms and object types. We further showcase the applicability of our method in a real-world robotic setting. For supplementary materials and videos, please visit: https://tufts-ai-robotics-group.github.io/FLEX/

arxiv情報

著者 Shijie Fang,Wenchang Gao,Shivam Goel,Christopher Thierauf,Matthias Scheutz,Jivko Sinapov
発行日 2025-03-17 17:49:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク