要約
オブジェクトのポーズ推定により、シーンの理解やロボットの把握など、コンピュータービジョンやロボット工学のさまざまなタスクが可能になります。
ポーズ推定タスクの複雑さは、ターゲットオブジェクトに関連する未知の変数に依存します。
インスタンスレベルのメソッドは、テクスチャ、形状、サイズが部分的または完全に未知のカテゴリレベルとオープンセットのメソッド、不透明なオブジェクトとランバートのオブジェクトにすでに優れていますが、これらの基本的な材料特性と格闘しています。
これらのシナリオではテクスチャは不明であるため、オブジェクトの対称性を編成するために使用することはできません。6Dオブジェクトのもう1つのコアチャレンジは推定されます。
このような不明なマニホールドで6Dポーズを推定する複雑さは、さまざまなデータセット、精度メトリック、およびアルゴリズムソリューションにつながりました。
このペーパーでは、カテゴリレベルで6Dポーズ推定を解くためのデータセット、精度メトリック、およびアルゴリズムを比較します。
この比較に基づいて、カテゴリレベルとオープンセットのオブジェクトのポーズ推定をブリッジする方法を分析して、一般化に到達し、実用的な推奨事項を提供します。
要約(オリジナル)
Object pose estimation enables a variety of tasks in computer vision and robotics, including scene understanding and robotic grasping. The complexity of a pose estimation task depends on the unknown variables related to the target object. While instance-level methods already excel for opaque and Lambertian objects, category-level and open-set methods, where texture, shape, and size are partially or entirely unknown, still struggle with these basic material properties. Since texture is unknown in these scenarios, it cannot be used for disambiguating object symmetries, another core challenge of 6D object pose estimation. The complexity of estimating 6D poses with such a manifold of unknowns led to various datasets, accuracy metrics, and algorithmic solutions. This paper compares datasets, accuracy metrics, and algorithms for solving 6D pose estimation on the category-level. Based on this comparison, we analyze how to bridge category-level and open-set object pose estimation to reach generalization and provide actionable recommendations.
arxiv情報
著者 | Peter Hönig,Matthias Hirschmanner,Markus Vincze |
発行日 | 2025-04-28 08:31:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google