要約
Yolov4は、DarkNetフレームワークを使用して回帰(境界ボックスの位置付け)と分類(オブジェクトクラス識別)のための高度な手法を組み合わせることにより、COCOデータセットで最高のパフォーマンスを達成しました。
精度と適応性を向上させるために、クロスミニバッチの正規化、クロスステージ特殊接続、自己副産物トレーニング、加重抵抗性接続、およびCIOU損失、モザイクデータの増強、ドロップブロックの正則化を採用しています。
モザイクの増強とマルチ解像度トレーニングにより、Yolov4は多様なシナリオで優れた検出を達成し、テスラV100で43.5 \%AP(対照的に65.7 \%AP50)を達成し、効率、手頃な価格、適応性を確保します。
実世界の環境。
要約(オリジナル)
YOLOv4 achieved the best performance on the COCO dataset by combining advanced techniques for regression (bounding box positioning) and classification (object class identification) using the Darknet framework. To enhance accuracy and adaptability, it employs Cross mini-Batch Normalization, Cross-Stage-Partial-connections, Self-Adversarial-Training, and Weighted-Residual-Connections, as well as CIoU loss, Mosaic data augmentation, and DropBlock regularization. With Mosaic augmentation and multi-resolution training, YOLOv4 achieves superior detection in diverse scenarios, attaining 43.5\% AP (in contrast, 65.7\% AP50) on a Tesla V100 at ~65 frames per second, ensuring efficiency, affordability, and adaptability for real-world environments.
arxiv情報
著者 | Athulya Sundaresan Geetha |
発行日 | 2025-02-06 15:45:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google