Viewpoint Equivariance for Multi-View 3D Object Detection

要約

視覚センサーからの 3D オブジェクト検出は、ロボット システムの基礎となる機能です。
最先端の方法は、マルチビュー カメラ入力からのオブジェクト バウンディング ボックスの推論とデコードに焦点を当てています。
この作業では、3D シーンの理解と幾何学的学習におけるマルチビューの一貫性の不可欠な役割から直感を得ます。
この目的のために、VEDet を紹介します。これは、3D マルチビュー ジオメトリを活用して、視点の認識と等価性によってローカリゼーションを改善する新しい 3D オブジェクト検出フレームワークです。
VEDet は、クエリベースのトランスフォーマー アーキテクチャを活用し、3D 遠近法ジオメトリからの位置エンコーディングで画像の特徴を増強することにより、3D シーンをエンコードします。
出力レベルでビュー条件付きクエリを設計します。これにより、トレーニング中に複数の仮想フレームを生成して、マルチビューの一貫性を強制することで視点の等価性を学習できます。
入力レベルで位置エンコーディングとして挿入され、損失レベルで正則化されたマルチビュー ジオメトリは、3D オブジェクト検出のための豊富な幾何学的キューを提供し、nuScenes ベンチマークで最先端のパフォーマンスをもたらします。
コードとモデルは、https://github.com/TRI-ML/VEDet で入手できます。

要約(オリジナル)

3D object detection from visual sensors is a cornerstone capability of robotic systems. State-of-the-art methods focus on reasoning and decoding object bounding boxes from multi-view camera input. In this work we gain intuition from the integral role of multi-view consistency in 3D scene understanding and geometric learning. To this end, we introduce VEDet, a novel 3D object detection framework that exploits 3D multi-view geometry to improve localization through viewpoint awareness and equivariance. VEDet leverages a query-based transformer architecture and encodes the 3D scene by augmenting image features with positional encodings from their 3D perspective geometry. We design view-conditioned queries at the output level, which enables the generation of multiple virtual frames during training to learn viewpoint equivariance by enforcing multi-view consistency. The multi-view geometry injected at the input level as positional encodings and regularized at the loss level provides rich geometric cues for 3D object detection, leading to state-of-the-art performance on the nuScenes benchmark. The code and model are made available at https://github.com/TRI-ML/VEDet.

arxiv情報

著者 Dian Chen,Jie Li,Vitor Guizilini,Rares Ambrus,Adrien Gaidon
発行日 2023-03-25 19:56:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク