要約
【タイトル】HouseCat6D — 実世界の家庭用オブジェクトを用いた大規模な多モーダルカテゴリーレベルの6Dオブジェクトポーズデータセット
【要約】
・3Dコンピュータビジョンの主要な問題である物体の6Dポーズの推定は、インスタンスレベルのアプローチから有望な成果が得られたことから、より実用的なアプリケーションシナリオのためにカテゴリーレベルのポーズ推定に向けられている。
・しかし、よく確立されたインスタンスレベルのポーズデータセットとは異なり、利用可能なカテゴリーレベルのデータセットは注釈品質や提供されるポーズの数量に欠けている。
・新しいカテゴリーレベルの6DポーズデータセットHouseCat6Dを提案している。
1) Polarimetric RGBとDepthの多モダリティ(RGBD+P)、
2) 10の家庭用オブジェクトカテゴリーの194の非常に多様なオブジェクト(2つの光学的に挑戦的なカテゴリーも含む)、
3) 1.35mmから1.74mmのエラーレンジを持つ高品質のポーズ注釈、
4) 視点カバレッジと覆い隠された領域が広範囲にわたる41の大規模シーン、
5) シーン全体でチェッカーボードフリーの環境、
6) さらに注釈された密な6D平行ジョーグラス
・さらに、最新のカテゴリーレベルのポーズ推定ネットワークのベンチマーク結果も提供している。
要約(オリジナル)
Estimating the 6D pose of objects is a major 3D computer vision problem. Since the promising outcomes from instance-level approaches, research heads also move towards category-level pose estimation for more practical application scenarios. However, unlike well-established instance-level pose datasets, available category-level datasets lack annotation quality and provided pose quantity. We propose the new category-level 6D pose dataset HouseCat6D featuring 1) Multi-modality of Polarimetric RGB and Depth (RGBD+P), 2) Highly diverse 194 objects of 10 household object categories including 2 photometrically challenging categories, 3) High-quality pose annotation with an error range of only 1.35 mm to 1.74 mm, 4) 41 large-scale scenes with extensive viewpoint coverage and occlusions, 5) Checkerboard-free environment throughout the entire scene, and 6) Additionally annotated dense 6D parallel-jaw grasps. Furthermore, we also provide benchmark results of state-of-the-art category-level pose estimation networks.
arxiv情報
著者 | HyunJun Jung,Shun-Cheng Wu,Patrick Ruhkamp,Hannah Schieber,Pengyuan Wang,Giulia Rizzoli,Hongcheng Zhao,Sven Damian Meier,Daniel Roth,Nassir Navab,Benjamin Busam |
発行日 | 2023-04-25 10:44:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI