WeightedPose: Generalizable Cross-Pose Estimation via Weighted SVD

要約

本論文では、2つの物体間の3次元幾何学的関係を推論する必要がある、人間環境におけるロボット操作タスクのための新しい手法を紹介する。従来のエンドツーエンドの学習された方針は、ピクセルの観察から低レベルのロボットアクションにマッピングされるが、複雑なポーズ関係を推論することに苦戦し、未知のオブジェクト構成に汎化することが困難である。これらの課題に対処するために、我々は、オブジェクト間の3次元幾何学的関係を推論する学習方法を提案する。我々の単体モデルは、多関節部品間のポーズ関係と、自由浮遊物体間のポーズ関係の両方を推論するために、重み付けSVDを利用する。このアプローチにより、ロボットは、例えばラザニアプレートとオーブンの関係と同様に、オーブンのドアとオーブン本体の関係を理解することができる。オブジェクト間の3次元幾何学的関係を考慮することで、我々の手法は、ロボットがオブジェクト中心の表現を推論する複雑な操作タスクを実行することを可能にする。我々はコードをオープンソース化し、その結果をここで実証している。

要約(オリジナル)

We present a novel method for robotic manipulation tasks in human environments that require reasoning about the 3D geometric relationship between a pair of objects. Traditional end-to-end trained policies, which map from pixel observations to low-level robot actions, struggle to reason about complex pose relationships and have difficulty generalizing to unseen object configurations. To address these challenges, we propose a method that learns to reason about the 3D geometric relationship between objects, focusing on the relationship between key parts on one object with respect to key parts on another object. Our standalone model utilizes Weighted SVD to reason about both pose relationships between articulated parts and between free-floating objects. This approach allows the robot to understand the relationship between the oven door and the oven body, as well as the relationship between the lasagna plate and the oven, for example. By considering the 3D geometric relationship between objects, our method enables robots to perform complex manipulation tasks that reason about object-centric representations. We open source the code and demonstrate the results here

arxiv情報

著者 Xuxin Cheng,Heng Yu,Harry Zhang,Wenxing Deng
発行日 2024-05-03 16:52:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク