要約
単眼 RGB 入力を使用した動的環境における短期的なオブジェクトの姿勢追跡の課題に対処するために、現実世界の条件の多様性を反映するように作成された大規模な合成データセット OmniPose6D を導入します。
さらに、姿勢追跡アルゴリズムを包括的に比較するためのベンチマーク フレームワークも紹介します。
確率的モデリングを採用して姿勢推定を改良する、不確実性を認識したキーポイント改良ネットワークを特徴とするパイプラインを提案します。
比較評価により、私たちのアプローチが実際のデータセットで既存のベースラインよりも優れたパフォーマンスを達成していることが実証され、動的コンテキストでの追跡精度を向上させる際の合成データセットと洗練技術の有効性が強調されています。
私たちの貢献は、複雑なシーンにおけるオブジェクトの姿勢追跡手法の開発と評価における新たな先例を作りました。
要約(オリジナル)
To address the challenge of short-term object pose tracking in dynamic environments with monocular RGB input, we introduce a large-scale synthetic dataset OmniPose6D, crafted to mirror the diversity of real-world conditions. We additionally present a benchmarking framework for a comprehensive comparison of pose tracking algorithms. We propose a pipeline featuring an uncertainty-aware keypoint refinement network, employing probabilistic modeling to refine pose estimation. Comparative evaluations demonstrate that our approach achieves performance superior to existing baselines on real datasets, underscoring the effectiveness of our synthetic dataset and refinement technique in enhancing tracking precision in dynamic contexts. Our contributions set a new precedent for the development and assessment of object pose tracking methodologies in complex scenes.
arxiv情報
| 著者 | Yunzhi Lin,Yipu Zhao,Fu-Jen Chu,Xingyu Chen,Weiyao Wang,Hao Tang,Patricio A. Vela,Matt Feiszli,Kevin Liang |
| 発行日 | 2024-10-09 09:01:40+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google