ODverse33: Is the New YOLO Version Always Better? A Multi Domain benchmark from YOLO v5 to v11

要約

さまざまなドメインにわたってリアルタイムオブジェクト検出器の構築に広く使用されている(Yolo)モデルが広く使用されています。
新しいYoloバージョンの頻度が増加すると、重要な質問が発生します。
新しいバージョンは、以前のバージョンよりも常に優れていますか?
各ヨロバージョンのコアイノベーションは何ですか?これらの変更は、実際のパフォーマンスの向上にどのようにつながりますか?
このホワイトペーパーでは、Yolov1からYolov11までの主要な革新を要約して、11の多様なドメイン(自律運転、農業、農業、農業、野生生物、レテール、微小微細、セキュリティ)に及ぶ33のデータセットを含むODVerse33と呼ばれる包括的なベンチマークを導入します。
広範な実験結果を通じて。
この研究が、オブジェクト検出モデルの広範なユーザーに何らかのガイダンスを提供し、将来のリアルタイムオブジェクト検出器開発のためのいくつかの参照を提供できることを願っています。

要約(オリジナル)

You Look Only Once (YOLO) models have been widely used for building real-time object detectors across various domains. With the increasing frequency of new YOLO versions being released, key questions arise. Are the newer versions always better than their previous versions? What are the core innovations in each YOLO version and how do these changes translate into real-world performance gains? In this paper, we summarize the key innovations from YOLOv1 to YOLOv11, introduce a comprehensive benchmark called ODverse33, which includes 33 datasets spanning 11 diverse domains (Autonomous driving, Agricultural, Underwater, Medical, Videogame, Industrial, Aerial, Wildlife, Retail, Microscopic, and Security), and explore the practical impact of model improvements in real-world, multi-domain applications through extensive experimental results. We hope this study can provide some guidance to the extensive users of object detection models and give some references for future real-time object detector development.

arxiv情報

著者 Tianyou Jiang,Yang Zhong
発行日 2025-04-11 12:06:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク