HouseCat6D — A Large-Scale Multi-Modal Category Level 6D Object Pose Dataset with Household Objects in Realistic Scenarios

要約

オブジェクトの 6D ポーズの推定は、3D コンピューター ビジョンの主要な分野の 1 つです。
インスタンス レベルのポーズ推定から有望な結果が得られたため、研究の傾向は、より実用的なアプリケーション シナリオのカテゴリ レベルのポーズ推定に向かっています。
ただし、十分に確立されたインスタンス レベルのポーズ データセットとは異なり、利用可能なカテゴリ レベルのデータセットには、アノテーションの品質と提供されるポーズの量がありません。
新しいカテゴリ レベルの 6D ポーズ データセット HouseCat6D を提案します。1) ポラリメトリック RGB+P と深度のマルチモダリティ、2) 測光的に難しい 2 つのカテゴリを含む 10 の家庭用オブジェクト カテゴリの非常に多様な 194 個のオブジェクト、3)
わずか 1.35 mm から 1.74 mm の誤差範囲、4) 視点を広範囲にカバーする 41 の大規模なシーン、5) シーン全体でチェッカーボードのない環境。
また、最先端のカテゴリ レベルの姿勢推定ネットワークのベンチマーク結果も提供します。

要約(オリジナル)

Estimating the 6D pose of objects is one of the major fields in 3D computer vision. Since the promising outcomes from instance-level pose estimation, the research trends are heading towards category-level pose estimation for more practical application scenarios. However, unlike well-established instance-level pose datasets, available category-level datasets lack annotation quality and provided pose quantity. We propose the new category level 6D pose dataset HouseCat6D featuring 1) Multi-modality of Polarimetric RGB+P and Depth, 2) Highly diverse 194 objects of 10 household object categories including 2 photometrically challenging categories, 3) High-quality pose annotation with an error range of only 1.35 mm to 1.74 mm, 4) 41 large scale scenes with extensive viewpoint coverage, 5) Checkerboard-free environment throughout the entire scene. We also provide benchmark results of state-of-the-art category-level pose estimation networks.

arxiv情報

著者 HyunJun Jung,Shun-Cheng Wu,Patrick Ruhkamp,Hannah Schieber,Pengyuan Wang,Giulia Rizzoli,Hongcheng Zhao,Sven Damian Meier,Daniel Roth,Nassir Navab,Benjamin Busam
発行日 2022-12-20 17:06:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク