要約
空中および衛星画像の可用性が高まるにつれて、ディープラーニングは、輸送資産管理、安全分析、都市計画の重要な可能性を示しています。
この研究では、Crosswalknetを紹介します。Crosswalknetは、15 cmの解像度航空画像からさまざまな種類の歩行者横断歩道を検出するために設計された堅牢で効率的な深い学習フレームワークです。
Crosswalknetには、方向の境界ボックス(OBB)を利用することにより、従来のオブジェクト検出戦略を改善する新しい検出アプローチが組み込まれ、方向に関係なく横断歩道を正確にキャプチャすることにより、検出精度を強化します。
畳み込みブロックの注意、デュアルブランチの空間ピラミッドプーリングファーストモジュール、コサインアニーリングなど、いくつかの最適化手法が実装され、パフォーマンスと効率を最大化します。
23,000を超える注釈付きクロスウォークインスタンスを含む包括的なデータセットが利用され、提案されたフレームワークを訓練および検証します。
最高のパフォーマンスモデルは、96.5%の印象的な精度と、マサチューセッツ州の航空画像の93.3%のリコールを実現し、その精度と有効性を示しています。
Crosswalknetは、移籍学習や微調整なしで、ニューハンプシャー州、バージニア州、メイン州のデータセットにも成功裏に適用され、その堅牢性と強力な一般化能力を示しています。
さらに、高性能コンピューティング(HPC)プラットフォームを使用して処理され、ポリゴンシェープファイル形式で提供されるクロスウォーク検出結果は、データ処理と検出を加速し、安全およびモビリティアプリケーションのリアルタイム分析をサポートすることが示されています。
この統合は、政策立案者、輸送エンジニア、都市計画者に、歩行者の安全性を高め、都市のモビリティを向上させるための効果的な手段を提供します。
要約(オリジナル)
With the increasing availability of aerial and satellite imagery, deep learning presents significant potential for transportation asset management, safety analysis, and urban planning. This study introduces CrosswalkNet, a robust and efficient deep learning framework designed to detect various types of pedestrian crosswalks from 15-cm resolution aerial images. CrosswalkNet incorporates a novel detection approach that improves upon traditional object detection strategies by utilizing oriented bounding boxes (OBB), enhancing detection precision by accurately capturing crosswalks regardless of their orientation. Several optimization techniques, including Convolutional Block Attention, a dual-branch Spatial Pyramid Pooling-Fast module, and cosine annealing, are implemented to maximize performance and efficiency. A comprehensive dataset comprising over 23,000 annotated crosswalk instances is utilized to train and validate the proposed framework. The best-performing model achieves an impressive precision of 96.5% and a recall of 93.3% on aerial imagery from Massachusetts, demonstrating its accuracy and effectiveness. CrosswalkNet has also been successfully applied to datasets from New Hampshire, Virginia, and Maine without transfer learning or fine-tuning, showcasing its robustness and strong generalization capability. Additionally, the crosswalk detection results, processed using High-Performance Computing (HPC) platforms and provided in polygon shapefile format, have been shown to accelerate data processing and detection, supporting real-time analysis for safety and mobility applications. This integration offers policymakers, transportation engineers, and urban planners an effective instrument to enhance pedestrian safety and improve urban mobility.
arxiv情報
著者 | Zubin Bhuyan,Yuanchang Xie,AngkeaReach Rith,Xintong Yan,Nasko Apostolov,Jimi Oke,Chengbo Ai |
発行日 | 2025-06-09 15:56:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google