要約
画像からの正確な6Dオブジェクトのポーズ推定は、オブジェクト中心のシーンの理解における重要な問題であり、ロボット工学、拡張現実、シーンの再構築のアプリケーションを可能にします。
最近の進歩にもかかわらず、既存の方法はしばしば物理的に一貫性のないポーズ推定値を生み出し、実際のシナリオでの展開を妨げます。
Physposeを紹介します。これは、物理的な推論をポーズ推定に統合し、不浸透性と重力の制約を強制するポストプロセスの最適化を通じてポーズ推定に統合します。
シーンのジオメトリを活用することにより、Physposeはポーズの見積もりを改良して、物理的な妥当性を確保します。
私たちのアプローチは、BOPベンチマークからYCB-Videoデータセットの最先端の精度を達成し、Hope-Videoデータセットの最先端のポーズ推定方法を改善します。
さらに、挑戦的なピックアンドプレイスタスクでの成功率を大幅に改善し、実際のアプリケーションにおける物理的な一貫性の重要性を強調することにより、ロボット工学への影響を実証します。
要約(オリジナル)
Accurate 6D object pose estimation from images is a key problem in object-centric scene understanding, enabling applications in robotics, augmented reality, and scene reconstruction. Despite recent advances, existing methods often produce physically inconsistent pose estimates, hindering their deployment in real-world scenarios. We introduce PhysPose, a novel approach that integrates physical reasoning into pose estimation through a postprocessing optimization enforcing non-penetration and gravitational constraints. By leveraging scene geometry, PhysPose refines pose estimates to ensure physical plausibility. Our approach achieves state-of-the-art accuracy on the YCB-Video dataset from the BOP benchmark and improves over the state-of-the-art pose estimation methods on the HOPE-Video dataset. Furthermore, we demonstrate its impact in robotics by significantly improving success rates in a challenging pick-and-place task, highlighting the importance of physical consistency in real-world applications.
arxiv情報
著者 | Martin Malenický,Martin Cífka,Médéric Fourmy,Louis Montaut,Justin Carpentier,Josef Sivic,Vladimir Petrik |
発行日 | 2025-03-30 20:52:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google