要約
バウンディング ボックス回帰 (BBR) の損失関数は、オブジェクト検出に不可欠です。
その優れた定義により、モデルのパフォーマンスが大幅に向上します。
ほとんどの既存の作業は、トレーニング データの例が高品質であることを前提としており、BBR 損失のフィッティング能力の強化に焦点を当てています。
低品質の例でやみくもに BBR を強化すると、ローカリゼーションのパフォーマンスが損なわれます。
この問題を解決するために Focal-EIoU v1 が提案されましたが、その静的集束メカニズム (FM) が原因で、非単調 FM の可能性は十分に活用されませんでした。
この考えに基づいて、Wise-IoU (WIoU) と呼ばれる動的で非単調な FM を使用した IoU ベースの損失を提案します。
WIoU を最先端のリアルタイム検出器 YOLOv7 に適用すると、MS-COCO データセットの AP-75 が 53.03% から 54.50% に改善されます。
要約(オリジナル)
The loss function for bounding box regression (BBR) is essential to object detection. Its good definition will bring significant performance improvement to the model. Most existing works assume that the examples in the training data are high-quality and focus on strengthening the fitting ability of BBR loss. If we blindly strengthen BBR on low-quality examples, it will jeopardize localization performance. Focal-EIoU v1 was proposed to solve this problem, but due to its static focusing mechanism (FM), the potential of non-monotonic FM was not fully exploited. Based on this idea, we propose an IoU-based loss with a dynamic non-monotonic FM named Wise-IoU (WIoU). When WIoU is applied to the state-of-the-art real-time detector YOLOv7, the AP-75 on the MS-COCO dataset is improved from 53.03% to 54.50%.
arxiv情報
著者 | Zanjia Tong,Yuhang Chen,Zewei Xu,Rong Yu |
発行日 | 2023-01-24 14:50:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google