要約
完全な深度情報と効率的な推定器は、自動運転タスクのシーン理解において重要な要素となっています。
LiDAR ベースの深度補完の主な問題は、無相関の LiDAR 点群のまばらな性質によって提供されるコヒーレントな情報が不足しているため、畳み込みの非効率的な利用であり、複雑でリソースを必要とするネットワークにつながることがよくあります。
この問題は、教師ありトレーニング用の深度データの取得に費用がかかることによって強化されます。
この作業では、vgg05 のような CNN アーキテクチャに基づく効率的な深度補完モデルを提案し、知識を合成データから現実世界のデータに転送してデータ効率を向上させ、大規模なデータベースの必要性を減らすための半教師付きドメイン適応アプローチを提案します。
.
空間的一貫性を高めるために、追加の情報源としてセグメンテーションを使用して学習プロセスをガイドします。
私たちのアプローチの効率と精度は、KITTI データセットで評価されます。
私たちのアプローチは、以前の効率的で低パラメーターの最先端のアプローチを改善しながら、計算フットプリントを大幅に削減します。
要約(オリジナル)
Complete depth information and efficient estimators have become vital ingredients in scene understanding for automated driving tasks. A major problem for LiDAR-based depth completion is the inefficient utilization of convolutions due to the lack of coherent information as provided by the sparse nature of uncorrelated LiDAR point clouds, which often leads to complex and resource-demanding networks. The problem is reinforced by the expensive aquisition of depth data for supervised training. In this work, we propose an efficient depth completion model based on a vgg05-like CNN architecture and propose a semi-supervised domain adaptation approach to transfer knowledge from synthetic to real world data to improve data-efficiency and reduce the need for a large database. In order to boost spatial coherence, we guide the learning process using segmentations as additional source of information. The efficiency and accuracy of our approach is evaluated on the KITTI dataset. Our approach improves on previous efficient and low parameter state of the art approaches while having a noticeably lower computational footprint.
arxiv情報
著者 | Fabian Märkert,Martin Sunkel,Anselm Haselhoff,Stefan Rudolph |
発行日 | 2022-12-14 17:38:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google