3D Harmonic Loss: Towards Task-consistent and Time-friendly 3D Object Detection on Edge for Intelligent Transportation System

要約

エッジコンピューティングに基づく3D知覚は、交通候補のリアルタイムモニタリングがVehicle-to-Everything(V2X)オーケストレーションを強化する可能性があるため、知的交通システム(ITS)において注目されています。LiDARは周囲の深度情報を正確に計測できるため、ライダーベースの3D検知に焦点を当てた研究が増えており、3D知覚の発展を大きく促進しています。しかし、計算負荷が高いため、エッジ展開のリアルタイム性を満たす手法はほとんどありません。また、点群領域では、スパース性が大きいため、物体検出の矛盾問題が未解決のままである。本論文では、画像特殊化における不整合問題の判定に関する最近の研究成果から包括的に喚起されたこの問題を徹底的に解析した。そこで、点群に基づく矛盾した予測を緩和するために、3次元調和損失関数を提案した。さらに、数学的最適化の観点から、3次元調和損失の実現可能性を示す。KITTIデータセットとDAIR-V2X-Iデータセットを用いてシミュレーションを行った結果、提案手法はベンチマークモデルよりも大幅に性能を向上させることができた。さらに、エッジデバイス(Jetson Xavier TX)を用いたシミュレーションにより、提案手法の効率性を検証しました。なお、本提案のコードはオープンソースで公開されています。

要約(オリジナル)

Edge computing-based 3D perception has received attention in intelligent transportation systems (ITS) because real-time monitoring of traffic candidates potentially strengthens Vehicle-to-Everything (V2X) orchestration. Thanks to the capability of precisely measuring the depth information on surroundings from LiDAR, the increasing studies focus on lidar-based 3D detection, which significantly promotes the development of 3D perception. Few methods met the real-time requirement of edge deployment because of high computation-intensive operations. Moreover, an inconsistency problem of object detection remains uncovered in the pointcloud domain due to large sparsity. This paper thoroughly analyses this problem, comprehensively roused by recent works on determining inconsistency problems in the image specialisation. Therefore, we proposed a 3D harmonic loss function to relieve the pointcloud based inconsistent predictions. Moreover, the feasibility of 3D harmonic loss is demonstrated from a mathematical optimization perspective. The KITTI dataset and DAIR-V2X-I dataset are used for simulations, and our proposed method considerably improves the performance than benchmark models. Further, the simulative deployment on an edge device (Jetson Xavier TX) validates our proposed model’s efficiency. Our code is open-source and publicly available.

arxiv情報

著者 Haolin Zhang,M S Mekala,Zulkar Nain,Ju H. Park,Ho-Youl Jung
発行日 2022-11-07 10:11:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク