Slice Transformer and Self-supervised Learning for 6DoF Localization in 3D Point Cloud Maps

要約

正確な位置特定は自動運転車にとって重要です。
私たちは、LiDAR データを使用した屋外位置特定のタスクに、Transformers を初めて採用した自己教師あり学習手法を紹介します。
$360^\circ$ LiDAR スキャンのスライスを再構成して軸方向の特性を活用するプレテキスト タスクを提案します。
Slice Transformer と呼ばれる私たちのモデルは、スライスを体系的に処理しながらマルチヘッド アテンションを採用します。
私たちの知る限り、これは屋外点群に対して複数頭の注意を活用した最初の例です。
さらに、$\sim$4km$^2$ エリアをカバーする西オーストラリア州パース市の大規模な LiDAR マップを提供する Perth-WA データセットを紹介します。
Perth-WA にはローカリゼーション アノテーションが提供されます。
提案された位置特定方法は、Perth-WA および Appollo-SouthBay データセットで徹底的に評価されています。
また、ModelNet40 および ScanNN データセットを使用して、オブジェクト分類の一般的な下流タスクに対する自己教師あり学習アプローチの有効性も確立します。
コードとパース-ワシントン州のデータは一般に公開されます。

要約(オリジナル)

Precise localization is critical for autonomous vehicles. We present a self-supervised learning method that employs Transformers for the first time for the task of outdoor localization using LiDAR data. We propose a pre-text task that reorganizes the slices of a $360^\circ$ LiDAR scan to leverage its axial properties. Our model, called Slice Transformer, employs multi-head attention while systematically processing the slices. To the best of our knowledge, this is the first instance of leveraging multi-head attention for outdoor point clouds. We additionally introduce the Perth-WA dataset, which provides a large-scale LiDAR map of Perth city in Western Australia, covering $\sim$4km$^2$ area. Localization annotations are provided for Perth-WA. The proposed localization method is thoroughly evaluated on Perth-WA and Appollo-SouthBay datasets. We also establish the efficacy of our self-supervised learning approach for the common downstream task of object classification using ModelNet40 and ScanNN datasets. The code and Perth-WA data will be publicly released.

arxiv情報

著者 Muhammad Ibrahim,Naveed Akhtar,Saeed Anwar,Michael Wise,Ajmal Mian
発行日 2023-08-13 05:53:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク