Rail Detection: An Efficient Row-based Network and A New Benchmark

要約

タイトル: Rail Detection:効率的な行ベースネットワークと新しいベンチマーク
要約:
– 鉄道の異常検知に必須のレール検出は、ビデオフレーム内の鉄道領域を特定することを目的とする。
– 多数の研究があるものの、オープンなベンチマークや高速ネットワークが存在せず、アルゴリズムの比較や開発が困難になっている。
– レーン検出の発展を受けて、レールデータベースと行ベースのレール検出手法を提案。
– 具体的には次の貢献を行う。
– 実世界の鉄道データセット「Rail-DB」を紹介。7432組の画像と注釈を備え、異なる照明、道路構造、視点から収集された画像が9のシーンに分類されている。
– 効率的な行ベースレール検出手法「Rail-Net」を紹介。軽量な畳み込みバックボーンとアンカー分類器を含む。レール検出プロセスを行ベースの選択問題として定式化し、代替セグメンテーション手法に比べて計算コストを削減。
– Rail-DBで、ResNetからVision Transformerまでのネットワークバックボーンを含む広範な実験を行い、Rail-Netが速度と精度の両面で有望なパフォーマンスを達成することを評価。軽量バージョンでも92.77%の精度と312フレーム/秒を達成。Rail-Netは、従来の方法よりも50.65%、セグメンテーション方法よりも5.86%優れている。
– データベースとコードはhttps://github.com/Sampson-Lee/Rail-Detectionにて公開されている。

要約(オリジナル)

Rail detection, essential for railroad anomaly detection, aims to identify the railroad region in video frames. Although various studies on rail detection exist, neither an open benchmark nor a high-speed network is available in the community, making algorithm comparison and development difficult. Inspired by the growth of lane detection, we propose a rail database and a row-based rail detection method. In detail, we make several contributions: (i) We present a real-world railway dataset, Rail-DB, with 7432 pairs of images and annotations. The images are collected from different situations in lighting, road structures, and views. The rails are labeled with polylines, and the images are categorized into nine scenes. The Rail-DB is expected to facilitate the improvement of rail detection algorithms. (ii) We present an efficient row-based rail detection method, Rail-Net, containing a lightweight convolutional backbone and an anchor classifier. Specifically, we formulate the process of rail detection as a row-based selecting problem. This strategy reduces the computational cost compared to alternative segmentation methods. (iii) We evaluate the Rail-Net on Rail-DB with extensive experiments, including cross-scene settings and network backbones ranging from ResNet to Vision Transformers. Our method achieves promising performance in terms of both speed and accuracy. Notably, a lightweight version could achieve 92.77% accuracy and 312 frames per second. The Rail-Net outperforms the traditional method by 50.65% and the segmentation one by 5.86%. The database and code are available at: https://github.com/Sampson-Lee/Rail-Detection.

arxiv情報

著者 Xinpeng Li,Xiaojiang Peng
発行日 2023-04-12 07:44:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク