要約
この研究は、航空画像から得られる道路車線情報に焦点を当て、自動運転車 (AV) 用の高解像度 (HD) マップのニーズに取り組んでいます。
地球観測データは地図作成に貴重なリソースを提供しますが、リモート センシングでは道路車線抽出に特化したモデルがまだ開発されていません。
この研究では、高精細リモートセンシング画像から道路車線標示を抽出するための 12 の基本的な深層学習ベースのセマンティック セグメンテーション モデルの広範な比較を実行し、部分的にラベル付けされたデータセットを使用した転移学習下でのパフォーマンスを評価します。
これらのモデルは、部分的にラベル付けされた Waterloo Urban Scene データセットで微調整され、SkyScapes データセットで事前トレーニングされ、部分的にラベル付けされた実際のモデル展開の想定されるシナリオをシミュレートしました。
微調整パフォーマンスと全体的なパフォーマンスを観察し、評価しました。
モデルは微調整後に大幅なパフォーマンスの向上を示し、平均 IoU スコアは 33.56% ~ 76.11% の範囲、再現率は 66.0% ~ 98.96% の範囲でした。
トランスフォーマーベースのモデルは畳み込みニューラル ネットワークを上回り、AV ナビゲーション用の HD マップ開発を強化する際のモデルの事前トレーニングと微調整の重要性が強調されました。
要約(オリジナル)
This research addresses the need for high-definition (HD) maps for autonomous vehicles (AVs), focusing on road lane information derived from aerial imagery. While Earth observation data offers valuable resources for map creation, specialized models for road lane extraction are still underdeveloped in remote sensing. In this study, we perform an extensive comparison of twelve foundational deep learning-based semantic segmentation models for road lane marking extraction from high-definition remote sensing images, assessing their performance under transfer learning with partially labeled datasets. These models were fine-tuned on the partially labeled Waterloo Urban Scene dataset, and pre-trained on the SkyScapes dataset, simulating a likely scenario of real-life model deployment under partial labeling. We observed and assessed the fine-tuning performance and overall performance. Models showed significant performance improvements after fine-tuning, with mean IoU scores ranging from 33.56% to 76.11%, and recall ranging from 66.0% to 98.96%. Transformer-based models outperformed convolutional neural networks, emphasizing the importance of model pre-training and fine-tuning in enhancing HD map development for AV navigation.
arxiv情報
著者 | Willow Liu,Shuxin Qiao,Kyle Gao,Hongjie He,Michael A. Chapman,Linlin Xu,Jonathan Li |
発行日 | 2024-10-15 17:37:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google