TopoMaskV2: Enhanced Instance-Mask-Based Formulation for the Road Topology Problem


中心線予測を強化するために、TopoMask と呼ばれる新しいアプローチを開発しました。
キーポイントまたはパラメトリック手法に依存する以前の手法とは異なり、TopoMask は、マスクされたアテンション ベースのトランスフォーマー アーキテクチャと組み合わせたインスタンス マスク ベースの定式化を利用します。
マスク インスタンスをフロー情報で強化し、マスクから中心線への変換に対応する後処理手法を設計するために、4 方向のラベル表現を導入します。
さらに、インスタンス マスクの定式化がパラメトリック ベジェ回帰に補完的な情報を提供し、両方の出力を融合することで検出とトポロジのパフォーマンスが向上することを示します。
さらに、リフト スプラット手法における柱の仮定の欠点を分析し、マルチ高さのビン構成を適応させます。
実験結果は、TopoMask が OpenLane-V2 データセットで最先端のパフォーマンスを達成し、V1.1 OLS ベースラインのサブセット A では 44.1 から 49.4、サブセット B では 44.7 から 51.8 に増加したことを示しています。


Recently, the centerline has become a popular representation of lanes due to its advantages in solving the road topology problem. To enhance centerline prediction, we have developed a new approach called TopoMask. Unlike previous methods that rely on keypoints or parametric methods, TopoMask utilizes an instance-mask-based formulation coupled with a masked-attention-based transformer architecture. We introduce a quad-direction label representation to enrich the mask instances with flow information and design a corresponding post-processing technique for mask-to-centerline conversion. Additionally, we demonstrate that the instance-mask formulation provides complementary information to parametric Bezier regressions, and fusing both outputs leads to improved detection and topology performance. Moreover, we analyze the shortcomings of the pillar assumption in the Lift Splat technique and adapt a multi-height bin configuration. Experimental results show that TopoMask achieves state-of-the-art performance in the OpenLane-V2 dataset, increasing from 44.1 to 49.4 for Subset-A and 44.7 to 51.8 for Subset-B in the V1.1 OLS baseline.


著者 M. Esat Kalfaoglu,Halil Ibrahim Ozturk,Ozsel Kilinc,Alptekin Temizel
発行日 2024-09-17 16:22:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク