要約
私たちは、一対のオブジェクト間の 3D 幾何学的な接続を理解する必要がある、人間の環境におけるロボット操作タスクのための新しいアプローチを導入します。
ピクセルの観察をロボットの動作に直接変換する従来のエンドツーエンドのトレーニング手法では、複雑な姿勢の関係を効果的に理解できないことが多く、新しいオブジェクトの構成に簡単に適応できません。
これらの問題を克服するために、私たちの方法は 3D 幾何学的関係、特にあるオブジェクトの重要な部分が別のオブジェクトの重要な部分とどのように関係しているかを学習することに焦点を当てています。
スタンドアロン モデルで加重 SVD を採用し、関節パーツと浮遊オブジェクトの両方の姿勢関係を分析します。
たとえば、私たちのモデルは、オーブンのドアとオーブン本体の間、およびラザニア皿とオーブンの間の空間関係を理解できます。
3D 幾何学的な接続に集中することで、私たちの戦略はロボットがオブジェクト中心の視点に基づいて複雑な操作タスクを実行できるようにします。
要約(オリジナル)
We introduce a new approach for robotic manipulation tasks in human settings that necessitates understanding the 3D geometric connections between a pair of objects. Conventional end-to-end training approaches, which convert pixel observations directly into robot actions, often fail to effectively understand complex pose rela- tionships and do not easily adapt to new object configurations. To overcome these issues, our method focuses on learning the 3D geometric relationships, particularly how critical parts of one object relate to those of another. We employ Weighted SVD in our standalone model to analyze pose relationships both in articulated parts and in free-floating objects. For instance, our model can comprehend the spatial relationship between an oven door and the oven body, as well as between a lasagna plate and the oven. By concentrating on the 3D geometric connections, our strategy empowers robots to carry out intricate manipulation tasks based on object-centric perspectives
arxiv情報
著者 | Xuxin Cheng,Heng Yu,Harry Zhang,Wenxing Deng |
発行日 | 2024-05-21 14:42:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google