EqvAfford: SE(3) Equivariance for Point-Level Affordance Learning

要約

人間は等変性を意識して世界を認識し、相互作用するため、さまざまなポーズでさまざまな物体を操作することが容易になります。
ロボット操作の場合、このような等価性は多くのシナリオにも存在します。
たとえば、引き出しのポーズがどのようなもの (移動、回転、傾斜) であっても、操作方法は一貫しています (ハンドルを握って線を引く)。
従来のモデルは通常、ロボット操作の等分散性を認識していないため、トレーニング用のデータが多くなり、新しいオブジェクトのポーズでパフォーマンスが低下する可能性がありますが、私たちは、ポイントレベルのアフォーダンス学習での等分散性を保証する新しい設計を備えた EqvAfford フレームワークを提案します。
下流のロボット操作に適しており、さまざまなポーズのオブジェクトに対する代表的なタスクで優れたパフォーマンスと一般化能力を備えています。

要約(オリジナル)

Humans perceive and interact with the world with the awareness of equivariance, facilitating us in manipulating different objects in diverse poses. For robotic manipulation, such equivariance also exists in many scenarios. For example, no matter what the pose of a drawer is (translation, rotation and tilt), the manipulation strategy is consistent (grasp the handle and pull in a line). While traditional models usually do not have the awareness of equivariance for robotic manipulation, which might result in more data for training and poor performance in novel object poses, we propose our EqvAfford framework, with novel designs to guarantee the equivariance in point-level affordance learning for downstream robotic manipulation, with great performance and generalization ability on representative tasks on objects in diverse poses.

arxiv情報

著者 Yue Chen,Chenrui Tie,Ruihai Wu,Hao Dong
発行日 2024-08-04 07:59:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク