YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

要約

YOLOシリーズは、長年にわたり、効率的な物体検出のための業界レベルのデファクトスタンダードであり続けています。YOLOコミュニティは、様々なハードウェアプラットフォームや豊富なシナリオでの利用を充実させるために、圧倒的に繁栄してきました。本テクニカルレポートでは、その限界に挑戦し、産業応用に向けた揺るぎないマインドを持って、一歩一歩前進しています。 実環境における高速・高精度の多様な要件を考慮し、産業界や学術界の最新の物体検出技術を幅広く調査しています。具体的には、ネットワーク設計、学習戦略、テスト技術、量子化、最適化手法などのアイデアを積極的に取り入れました。その上で、多様なユースケースに対応するために、様々なスケールで展開可能なネットワーク群を構築するために、我々の考えと実践を統合する。YOLOの作者たちの寛大な許可を得て、私たちはこれをYOLOv6と名付けました。また、さらなる改良のため、ユーザーやコントリビューターを暖かく歓迎します。YOLOv6-Nは、COCOデータセットにおいて、NVIDIA Tesla T4 GPUで1234 FPSのスループットで35.9%のAPを達成しました。YOLOv6-Sは43.5%のAPを495 FPSで達成し、同規模の他の主流検出器(YOLOv5-S、YOLOX-S、PPYOLOE-S)を凌駕しています。さらに、量子化されたYOLOv6-Sでは、869FPSで43.3%のAPを達成し、最新鋭の性能を実現しました。さらに、YOLOv6-M/Lは、同程度の推論速度で他の検出器よりも高い精度(49.5%/52.3%)を達成しています。各コンポーネントの有効性を検証するために、慎重に実験を行いました。我々のコードは、https://github.com/meituan/YOLOv6 で公開されています。

要約(オリジナル)

For years, the YOLO series has been the de facto industry-level standard for efficient object detection. The YOLO community has prospered overwhelmingly to enrich its use in a multitude of hardware platforms and abundant scenarios. In this technical report, we strive to push its limits to the next level, stepping forward with an unwavering mindset for industry application. Considering the diverse requirements for speed and accuracy in the real environment, we extensively examine the up-to-date object detection advancements either from industry or academia. Specifically, we heavily assimilate ideas from recent network design, training strategies, testing techniques, quantization, and optimization methods. On top of this, we integrate our thoughts and practice to build a suite of deployment-ready networks at various scales to accommodate diversified use cases. With the generous permission of YOLO authors, we name it YOLOv6. We also express our warm welcome to users and contributors for further enhancement. For a glimpse of performance, our YOLOv6-N hits 35.9% AP on the COCO dataset at a throughput of 1234 FPS on an NVIDIA Tesla T4 GPU. YOLOv6-S strikes 43.5% AP at 495 FPS, outperforming other mainstream detectors at the same scale~(YOLOv5-S, YOLOX-S, and PPYOLOE-S). Our quantized version of YOLOv6-S even brings a new state-of-the-art 43.3% AP at 869 FPS. Furthermore, YOLOv6-M/L also achieves better accuracy performance (i.e., 49.5%/52.3%) than other detectors with a similar inference speed. We carefully conducted experiments to validate the effectiveness of each component. Our code is made available at https://github.com/meituan/YOLOv6.

arxiv情報

著者 Chuyi Li,Lulu Li,Hongliang Jiang,Kaiheng Weng,Yifei Geng,Liang Li,Zaidan Ke,Qingyuan Li,Meng Cheng,Weiqiang Nie,Yiduo Li,Bo Zhang,Yufei Liang,Linyuan Zhou,Xiaoming Xu,Xiangxiang Chu,Xiaoming Wei,Xiaolin Wei
発行日 2022-09-07 07:47:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク