ToolEENet: Tool Affordance 6D Pose Estimation


この制限を克服するために、私たちは革新的な TOOLEE データセットを紹介します。これは、私たちの知る限り、ツールのエンドエフェクター (EE) のアフォーダンス セグメンテーションと、その使用法に基づいて定義された 6D ポーズを特徴とする最初のデータセットです。
さらに、ツールの EE の正確な 6D 姿勢推定のための ToolEENet フレームワークを提案します。
このフレームワークは、生の RGBD データからツールの EE をセグメント化することから始まり、次に拡散モデルベースの姿勢推定器を使用して、カテゴリ固有のレベルで 6D 姿勢推定を行います。
すべてのデータとコードはプロジェクトの Web サイトで入手できます:


The exploration of robotic dexterous hands utilizing tools has recently attracted considerable attention. A significant challenge in this field is the precise awareness of a tool’s pose when grasped, as occlusion by the hand often degrades the quality of the estimation. Additionally, the tool’s overall pose often fails to accurately represent the contact interaction, thereby limiting the effectiveness of vision-guided, contact-dependent activities. To overcome this limitation, we present the innovative TOOLEE dataset, which, to the best of our knowledge, is the first to feature affordance segmentation of a tool’s end-effector (EE) along with its defined 6D pose based on its usage. Furthermore, we propose the ToolEENet framework for accurate 6D pose estimation of the tool’s EE. This framework begins by segmenting the tool’s EE from raw RGBD data, then uses a diffusion model-based pose estimator for 6D pose estimation at a category-specific level. Addressing the issue of symmetry in pose estimation, we introduce a symmetry-aware pose representation that enhances the consistency of pose estimation. Our approach excels in this field, demonstrating high levels of precision and generalization. Furthermore, it shows great promise for application in contact-based manipulation scenarios. All data and codes are available on the project website:


著者 Yunlong Wang,Lei Zhang,Yuyang Tu,Hui Zhang,Kaixin Bai,Zhaopeng Chen,Jianwei Zhang
発行日 2024-04-05 16:05:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.RO パーマリンク