HouseCat6D — A Large-Scale Multi-Modal Category Level 6D Object Pose Dataset with Household Objects in Realistic Scenarios

要約

オブジェクトの 6D ポーズの推定は、3D コンピュータービジョンの主要な分野の 1 つです。
インスタンスレベルのポーズ推定から有望な結果が得られたため、研究の傾向は、より実用的なアプリケーションシナリオのカテゴリレベルのポーズ推定に向かっています。
ただし、十分に確立されたインスタンスレベルのポーズデータセットとは異なり、利用可能なカテゴリレベルのデータセットには、アノテーションの品質と提供されるポーズの量がありません。
新しいカテゴリレベルの 6D ポーズデータセット HouseCat6D を提案します。1) ポラリメトリック RGB+P と深度のマルチモダリティ、2) 測光的に難しい 2 つのカテゴリを含む 10 の家庭用オブジェクトカテゴリの非常に多様な 194 個のオブジェクト、3)
わずか 1.35 mm から 1.74 mm の誤差範囲、4) 視点を広範囲にカバーする 41 の大規模なシーン、5) シーン全体でチェッカーボードのない環境。
また、最先端のカテゴリレベルの姿勢推定ネットワークのベンチマーク結果も提供します。

要約(オリジナル)

Estimating the 6D pose of objects is one of the major fields in 3D computer vision. Since the promising outcomes from instance-level pose estimation, the research trends are heading towards category-level pose estimation for more practical application scenarios. However, unlike well-established instance-level pose datasets, available category-level datasets lack annotation quality and provided pose quantity. We propose the new category level 6D pose dataset HouseCat6D featuring 1) Multi-modality of Polarimetric RGB+P and Depth, 2) Highly diverse 194 objects of 10 household object categories including 2 photometrically challenging categories, 3) High-quality pose annotation with an error range of only 1.35 mm to 1.74 mm, 4) 41 large scale scenes with extensive viewpoint coverage, 5) Checkerboard-free environment throughout the entire scene. We also provide benchmark results of state-of-the-art category-level pose estimation networks.

arxiv情報

著者	HyunJun Jung,Shun-Cheng Wu,Patrick Ruhkamp,Hannah Schieber,Pengyuan Wang,Giulia Rizzoli,Hongcheng Zhao,Sven Damian Meier,Daniel Roth,Nassir Navab,Benjamin Busam
発行日	2022-12-21 09:45:53+00:00
arxivサイト	arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

HouseCat6D — A Large-Scale Multi-Modal Category Level 6D Object Pose Dataset with Household Objects in Realistic Scenarios

要約

要約(オリジナル)

arxiv情報

提供元, 利用サービス

最近の投稿

最近のコメント

アーカイブ

カテゴリー