要約
オブジェクトの姿勢推定は、3D 視覚の領域内の重要な領域を構成します。
現実世界のポーズの注釈を活用する現代の最先端の手法は賞賛に値するパフォーマンスを示していますが、そのような現実世界のトレーニング データの調達には多額のコストがかかります。
このペーパーでは、背景や雑然とした情報を一切排除して、3D CAD モデルのみが事前知識として利用される特定の設定に焦点を当てています。
シミュレーションからリアルへの姿勢推定のために設計された新しい方法 CPPF++ を紹介します。
この方法は、CPPF の基本的なポイントペア投票スキームに基づいて構築されており、確率的レンズを通して再概念化されています。
投票の衝突という課題に対処するために、正準空間内の各点ペアの確率分布を推定することで投票の不確実性をモデル化します。
このアプローチは、背景や乱雑さに関連する投票を根絶するために使用される反復ノイズ フィルターによってさらに強化されます。
さらに、$N$-point タプルを導入することで、各投票ユニットによって提供されるコンテキストを強化します。
この方法論的貢献と併せて、新しいカテゴリレベルの姿勢推定データセットである DiversePose 300 を紹介します。このデータセットは、より広範でより困難な配列を網羅し、現在の最先端の方法のより厳密な評価を容易にするために特別に作成されています。
現実世界のシナリオ。
経験的な結果は、私たちが提案した方法の有効性を実証し、シミュレーションと現実世界のパフォーマンスの間の差異が大幅に減少することを明らかにしています。
要約(オリジナル)
Object pose estimation constitutes a critical area within the domain of 3D vision. While contemporary state-of-the-art methods that leverage real-world pose annotations have demonstrated commendable performance, the procurement of such real-world training data incurs substantial costs. This paper focuses on a specific setting wherein only 3D CAD models are utilized as a priori knowledge, devoid of any background or clutter information. We introduce a novel method, CPPF++, designed for sim-to-real pose estimation. This method builds upon the foundational point-pair voting scheme of CPPF, reconceptualizing it through a probabilistic lens. To address the challenge of voting collision, we model voting uncertainty by estimating the probabilistic distribution of each point pair within the canonical space. This approach is further augmented by iterative noise filtering, employed to eradicate votes associated with backgrounds or clutters. Additionally, we enhance the context provided by each voting unit by introducing $N$-point tuples. In conjunction with this methodological contribution, we present a new category-level pose estimation dataset, DiversePose 300. This dataset is specifically crafted to facilitate a more rigorous evaluation of current state-of-the-art methods, encompassing a broader and more challenging array of real-world scenarios. Empirical results substantiate the efficacy of our proposed method, revealing a significant reduction in the disparity between simulation and real-world performance.
arxiv情報
著者 | Yang You,Wenhao He,Jin Liu,Hongkai Xiong,Weiming Wang,Cewu Lu |
発行日 | 2023-09-06 16:47:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google