Semantic Scene Completion Based 3D Traversability Estimation for Off-Road Terrains

要約

オフロード環境では、構造化された道路が存在せず、不均一な地形、植生、遮蔽物などの複雑な障害物が存在するため、自律型地上車両にとって重大な課題が生じます。
主に構造化環境向けに設計された従来の認識アルゴリズムは、これらの条件下では失敗することが多く、不正確な通過可能性の推定につながります。
この論文では、LiDAR 点群と単眼画像を組み合わせた新しいマルチモーダル手法である ORDformer を提案し、前向きの視点から高密度の通過可能な占有予測を生成します。
マルチモーダル データを統合することにより、環境特徴の抽出が強化されます。これは、複雑な地形での占有率を正確に推定するために不可欠です。
さらに、段差の高さ、傾斜、凹凸などの幾何学的特徴を組み込んだ、3D 横断可能な占有アノテーションを備えたデータセットである RELLIS-OCC が導入されています。
車両の障害物通過条件の包括的な分析と車体構造の制約の組み込みにより、致命的、中コスト、低コスト、無料の 4 つの通過可能コスト ラベルが生成されます。
実験結果は、ORDformer が 3D 走行可能エリア認識において、特に不規則な形状や部分的なオクルージョンのあるオフロード環境において、既存のアプローチよりも優れていることを示しています。
具体的には、ORDformer は他のモデルと比較して、シーン完了 IoU で 20\% 以上の向上を達成しています。
提案されたフレームワークは拡張可能で、さまざまな車両プラットフォームに適応できるため、占有グリッド パラメーターの調整や、通過コスト推定のための高度な動的モデルの統合が可能になります。

要約(オリジナル)

Off-road environments present significant challenges for autonomous ground vehicles due to the absence of structured roads and the presence of complex obstacles, such as uneven terrain, vegetation, and occlusions. Traditional perception algorithms, designed primarily for structured environments, often fail under these conditions, leading to inaccurate traversability estimations. In this paper, ORDformer, a novel multimodal method that combines LiDAR point clouds with monocular images, is proposed to generate dense traversable occupancy predictions from a forward-facing perspective. By integrating multimodal data, environmental feature extraction is enhanced, which is crucial for accurate occupancy estimation in complex terrains. Furthermore, RELLIS-OCC, a dataset with 3D traversable occupancy annotations, is introduced, incorporating geometric features such as step height, slope, and unevenness. Through a comprehensive analysis of vehicle obstacle-crossing conditions and the incorporation of vehicle body structure constraints, four traversability cost labels are generated: lethal, medium-cost, low-cost, and free. Experimental results demonstrate that ORDformer outperforms existing approaches in 3D traversable area recognition, particularly in off-road environments with irregular geometries and partial occlusions. Specifically, ORDformer achieves over a 20\% improvement in scene completion IoU compared to other models. The proposed framework is scalable and adaptable to various vehicle platforms, allowing for adjustments to occupancy grid parameters and the integration of advanced dynamic models for traversability cost estimation.

arxiv情報

著者 Zitong Chen,Chao Sun,Shida Nie,Chen Min,Changjiu Ning,Haoyu Li,Bo Wang
発行日 2024-12-11 08:36:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク