要約
単眼での奥行き推定は、自律走行や他の多くのコンピュータビジョンアプリケーションにとって重要なタスクである。この分野では大きな進展が見られる一方で、奥行き推定モデルに対する視点移動の影響については、ほとんど未解明のままである。本論文では、異なるカメラ位置と向きが単眼深度推定性能に与える影響を定量化するための新しいデータセットと評価手法を紹介する。ホモグラフィ推定と物体検出に基づくグランドトゥルース戦略を提案し、高価なLIDARセンサーの必要性を排除する。複数の視点から道路シーンの多様なデータセットを収集し、それを用いて幾何学的なシフトに対する最新の奥行き推定モデルの頑健性を評価する。公開データセット上で我々の戦略の有効性を評価した後、現在のモデルの限界に関する貴重な洞察を提供し、実世界のアプリケーションにおいて視点の変化を考慮することの重要性を強調する。
要約(オリジナル)
Monocular depth estimation is a critical task for autonomous driving and many other computer vision applications. While significant progress has been made in this field, the effects of viewpoint shifts on depth estimation models remain largely underexplored. This paper introduces a novel dataset and evaluation methodology to quantify the impact of different camera positions and orientations on monocular depth estimation performance. We propose a ground truth strategy based on homography estimation and object detection, eliminating the need for expensive LIDAR sensors. We collect a diverse dataset of road scenes from multiple viewpoints and use it to assess the robustness of a modern depth estimation model to geometric shifts. After assessing the validity of our strategy on a public dataset, we provide valuable insights into the limitations of current models and highlight the importance of considering viewpoint variations in real-world applications.
arxiv情報
著者 | Aurel Pjetri,Stefano Caprasecca,Leonardo Taccari,Matteo Simoncini,Henrique Piñeiro Monteagudo,Wallace Walter,Douglas Coimbra de Andrade,Francesco Sambo,Andrew David Bagdanov |
発行日 | 2025-02-03 16:19:35+00:00 |
arxivサイト | arxiv_id(pdf) |