Wise-IoU: Bounding Box Regression Loss with Dynamic Focusing Mechanism

要約

バウンディングボックス回帰(BBR)の損失関数は、物体検出には不可欠である。その良い定義は、モデルに大きな性能向上をもたらす。ほとんどの既存研究は、学習データの例が高品質であることを仮定し、BBR損失の適合能力を強化することに焦点を当てている。もし、低品質な例に対してやみくもにBBRを強化すると、ローカライゼーションの性能が低下してしまう。この問題を解決するためにFocal-EIoU v1が提案されたが、静的な焦点合わせ機構(FM)のため、非単調なFMの可能性が十分に生かされていない。この考えに基づき、我々はWise-IoU(WIoU)と名付けた動的な非単調FMを持つIoUベースの損失を提案する。動的非単調FMは、アンカーボックスの品質を評価するために、IoUの代わりに外れ値度を用い、ワイズグラディエントゲイン配分戦略を提供する。この戦略は、高品質のアンカーボックスの競争力を低下させると同時に、低品質の例から発生する有害な勾配を減少させる。これにより、WIoUは通常品質のアンカーボックスに焦点を当て、検出器全体の性能を向上させることができる。WIoUを最先端のリアルタイム検出器YOLOv7に適用した場合、MS-COCOデータセットにおけるAP-75は53.03%から54.50%に改善されることがわかった。コードは https://github.com/Instinct323/wiou で公開されています。

要約(オリジナル)

The loss function for bounding box regression (BBR) is essential to object detection. Its good definition will bring significant performance improvement to the model. Most existing works assume that the examples in the training data are high-quality and focus on strengthening the fitting ability of BBR loss. If we blindly strengthen BBR on low-quality examples, it will jeopardize localization performance. Focal-EIoU v1 was proposed to solve this problem, but due to its static focusing mechanism (FM), the potential of non-monotonic FM was not fully exploited. Based on this idea, we propose an IoU-based loss with a dynamic non-monotonic FM named Wise-IoU (WIoU). The dynamic non-monotonic FM uses the outlier degree instead of IoU to evaluate the quality of anchor boxes and provides a wise gradient gain allocation strategy. This strategy reduces the competitiveness of high-quality anchor boxes while also reducing the harmful gradient generated by low-quality examples. This allows WIoU to focus on ordinary-quality anchor boxes and improve the detector’s overall performance. When WIoU is applied to the state-of-the-art real-time detector YOLOv7, the AP-75 on the MS-COCO dataset is improved from 53.03% to 54.50%. Code is available at https://github.com/Instinct323/wiou.

arxiv情報

著者 Zanjia Tong,Yuhang Chen,Zewei Xu,Rong Yu
発行日 2023-02-03 14:05:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク