High and Low Resolution Tradeoffs in Roadside Multimodal Sensing

要約

高解像度と低解像度のポイントクラウドロードサイドセンサーを選択する場合、バランスの取れたコストとパフォーマンスが重要です。
たとえば、LIDARは密なポイントクラウドを提供しますが、4Dミリ波レーダーは、空間的にはまばらですが、オブジェクトを区別し、低価格にするのに役立つ速度キューを埋め込みます。
残念ながら、センサー配置戦略は、カバレッジエリア全体のポイントクラウド密度と分布に影響します。
最初の課題を悪化させるのは、異なるセンサー混合物がしばしば、補完的な強さを最大化するために明確なニューラルネットワークアーキテクチャを必要とすることが多いという事実です。
比較のためのベンチマークを確立する評価フレームワークがなければ、わずかな利益がより高い解像度と新しいセンシングモダリティまたはアルゴリズムから生じるかどうかに関して主張することは不正です。
2つの課題に対処する元の評価を提示します。
まず、整数プログラミングを構築するシミュレーションツールを実現し、異なるセンサー配置戦略をカバレッジとコストと共同で自動的に比較します。
さらに、人間の多感覚統合に触発されて、トラフィック参加者を検出する際の情報豊かさによって空間分解能の削減が補償できるかどうかを評価するためのモジュラーフレームワークを提案します。
提案されたフレームワークでの広範な実験テストは、速度エンコードレーダーと低解像度のLIDARとの融合が得られることを示しています。
特に、これらの顕著な利益は、フレームに使用される特定の深い神経モジュールに関係なく保持されます。
結果は、高解像度が常に低解像度の代替品よりも優れているという一般的な仮定に挑戦します。

要約(オリジナル)

Balancing cost and performance is crucial when choosing high- versus low-resolution point-cloud roadside sensors. For example, LiDAR delivers dense point cloud, while 4D millimeter-wave radar, though spatially sparser, embeds velocity cues that help distinguish objects and come at a lower price. Unfortunately, the sensor placement strategies will influence point cloud density and distribution across the coverage area. Compounding the first challenge is the fact that different sensor mixtures often demand distinct neural network architectures to maximize their complementary strengths. Without an evaluation framework that establishes a benchmark for comparison, it is imprudent to make claims regarding whether marginal gains result from higher resolution and new sensing modalities or from the algorithms. We present an ex-ante evaluation that addresses the two challenges. First, we realized a simulation tool that builds on integer programming to automatically compare different sensor placement strategies against coverage and cost jointly. Additionally, inspired by human multi-sensory integration, we propose a modular framework to assess whether reductions in spatial resolution can be compensated by informational richness in detecting traffic participants. Extensive experimental testing on the proposed framework shows that fusing velocity-encoded radar with low-resolution LiDAR yields marked gains (14 percent AP for pedestrians and an overall mAP improvement of 1.5 percent across six categories) at lower cost than high-resolution LiDAR alone. Notably, these marked gains hold regardless of the specific deep neural modules employed in our frame. The result challenges the prevailing assumption that high resolution are always superior to low-resolution alternatives.

arxiv情報

著者 Shaozu Ding,Yihong Tang,Marco De Vincenzi,Dajiang Suo
発行日 2025-05-05 14:03:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク