Bangladeshi Native Vehicle Detection in Wild

要約

自律ナビゲーションの成功は、堅牢かつ正確な車両認識にかかっていますが、地域固有の車両検出データセットの不足によって妨げられ、コンテキスト認識システムの開発が妨げられています。
地上物体検出研究を推進するために、この論文ではバングラデシュで最も一般的に出現する車両クラスのネイティブ車両検出データセットを提案します。
17,326 個の画像の 81,542 個のインスタンスに完全に注釈が付けられ、17 の異なる車両クラスが考慮されています。
各画像の幅は少なくとも 1280px に設定されます。
データセットの車両境界ボックスと画像の平均比率は 4.7036 です。
このバングラデシュ固有車両データセット (BNVD) は、いくつかの地理、照明、さまざまな車両サイズ、向きを考慮して、不意のシナリオに対してより堅牢になります。
BNVD データセットを調べるというコンテキストで、この作業では、4 つの連続する You Only Look Once (YOLO) モデル、つまり YOLO v5、v6、v7、および v8 を使用した徹底的な評価を提供します。
これらのデータセットの有効性は系統的に評価され、すでに使用されている他の車両データセットと比較されます。
BNVD データセットは、和集合に対する交差 (IoU) の 50% における平均平均精度 (mAP) が 0.848 で、対応する精度と再現率の値が 0.841 および 0.774 であることを示します。
研究結果は、0.5 ~ 0.95 の IoU 範囲での mAP が 0.643 であることを示しています。
実験では、BNVD データセットが車両分布の信頼できる表現として機能し、かなりの複雑さを示すことが示されました。

要約(オリジナル)

The success of autonomous navigation relies on robust and precise vehicle recognition, hindered by the scarcity of region-specific vehicle detection datasets, impeding the development of context-aware systems. To advance terrestrial object detection research, this paper proposes a native vehicle detection dataset for the most commonly appeared vehicle classes in Bangladesh. 17 distinct vehicle classes have been taken into account, with fully annotated 81542 instances of 17326 images. Each image width is set to at least 1280px. The dataset’s average vehicle bounding box-to-image ratio is 4.7036. This Bangladesh Native Vehicle Dataset (BNVD) has accounted for several geographical, illumination, variety of vehicle sizes, and orientations to be more robust on surprised scenarios. In the context of examining the BNVD dataset, this work provides a thorough assessment with four successive You Only Look Once (YOLO) models, namely YOLO v5, v6, v7, and v8. These dataset’s effectiveness is methodically evaluated and contrasted with other vehicle datasets already in use. The BNVD dataset exhibits mean average precision(mAP) at 50% intersection over union (IoU) is 0.848 corresponding precision and recall values of 0.841 and 0.774. The research findings indicate a mAP of 0.643 at an IoU range of 0.5 to 0.95. The experiments show that the BNVD dataset serves as a reliable representation of vehicle distribution and presents considerable complexities.

arxiv情報

著者 Bipin Saha,Md. Johirul Islam,Shaikh Khaled Mostaque,Aditya Bhowmik,Tapodhir Karmakar Taton,Md. Nakib Hayat Chowdhury,Mamun Bin Ibne Reaz
発行日 2024-05-20 16:23:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク