要約
自動運転データセット内の点群のセマンティック セグメンテーションには、広い視野にわたって多数の点を処理できる技術が必要です。
現在、このタスク用に設計されたディープ ネットワークのほとんどは、3D スパース畳み込みを利用して、メモリと計算負荷を削減しています。
次に、最良の方法では、円柱ボクセルや距離画像 (複数の点群表現からの特徴融合用) など、回転 LIDAR サンプリング パターンの特異性をさらに活用してパフォーマンスをさらに向上させます。
対照的に、これらの特殊なツールを使用せずに、パフォーマンスの高いポイントベースのバックボーンを構築できることを示します。
このバックボーンである WaffleIron は、一般的な MLP と高密度の 2D 畳み込みに大きく依存しているため、実装が容易であり、調整が容易なパラメーターがいくつか含まれています。
そのシンプルさにもかかわらず、SemanticKITTI と nuScenes に関する私たちの実験は、WaffleIron がこれらの自動運転データセット用に特別に設計された最良の方法と競合することを示しています。
したがって、WaffleIron は、まばらな屋外点群のセマンティック セグメンテーションのための強力で実装が容易なベースラインです。
要約(オリジナル)
Semantic segmentation of point clouds in autonomous driving datasets requires techniques that can process large numbers of points over large field of views. Today, most deep networks designed for this task exploit 3D sparse convolutions to reduce memory and computational loads. The best methods then further exploit specificities of rotating lidar sampling patterns to further improve the performance, e.g., cylindrical voxels, or range images (for feature fusion from multiple point cloud representations). In contrast, we show that one can build a well-performing point-based backbone free of these specialized tools. This backbone, WaffleIron, relies heavily on generic MLPs and dense 2D convolutions, making it easy to implement, and contains just a few parameters easy to tune. Despite its simplicity, our experiments on SemanticKITTI and nuScenes show that WaffleIron competes with the best methods designed specifically for these autonomous driving datasets. Hence, WaffleIron is a strong, easy-to-implement, baseline for semantic segmentation of sparse outdoor point clouds.
arxiv情報
著者 | Gilles Puy,Alexandre Boulch,Renaud Marlet |
発行日 | 2023-01-24 16:10:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google