What is YOLOv6? A Deep Insight into the Object Detection Model

要約

この作業では、YOLOv6 オブジェクト検出モデルを詳しく調査し、その設計フレームワーク、最適化手法、検出機能に焦点を当てます。
YOLOv6 のコア要素は、堅牢な特徴抽出のための EfficientRep バックボーンと、シームレスな特徴集約のための Rep-PAN ネックで構成され、高パフォーマンスの物体検出を保証します。
COCO データセットで評価した場合、YOLOv6-N は、NVIDIA Tesla T4 GPU で 1187 FPS で 37.5\% AP を達成しました。
YOLOv6-S は 484 FPS で 45.0\% AP に達し、同じクラスの PPYOLOE-S、YOLOv5-S、YOLOX-S、YOLOv8-S などのモデルを上回ります。
さらに、YOLOv6-M と YOLOv6-L は、他の検出器と同等の推論速度を維持しながら、より優れた精度 (50.0\% および 52.8\%) も示しています。
アップグレードされたバックボーンとネック構造により、YOLOv6-L6 はリアルタイムで最先端の精度を実現します。

要約(オリジナル)

This work explores the YOLOv6 object detection model in depth, concentrating on its design framework, optimization techniques, and detection capabilities. YOLOv6’s core elements consist of the EfficientRep Backbone for robust feature extraction and the Rep-PAN Neck for seamless feature aggregation, ensuring high-performance object detection. Evaluated on the COCO dataset, YOLOv6-N achieves 37.5\% AP at 1187 FPS on an NVIDIA Tesla T4 GPU. YOLOv6-S reaches 45.0\% AP at 484 FPS, outperforming models like PPYOLOE-S, YOLOv5-S, YOLOX-S, and YOLOv8-S in the same class. Moreover, YOLOv6-M and YOLOv6-L also show better accuracy (50.0\% and 52.8\%) while maintaining comparable inference speeds to other detectors. With an upgraded backbone and neck structure, YOLOv6-L6 delivers cutting-edge accuracy in real-time.

arxiv情報

著者 Athulya Sundaresan Geetha
発行日 2024-12-17 15:26:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク