要約
境界ボックス回帰損失は、検出器位置特定ブランチの重要なコンポーネントとして、物体検出タスクにおいて重要な役割を果たします。
既存のバウンディング ボックス回帰手法は通常、GT ボックスと予測ボックスの間の幾何学的関係を考慮し、バウンディング ボックスの相対的な位置と形状を使用して損失を計算しますが、形状やスケールなどの固有のプロパティの影響は無視されます。
バウンディングボックス回帰のバウンディングボックス。
既存の研究の欠点を補うために、この記事ではバウンディング ボックス自体の形状とスケールに焦点を当てたバウンディング ボックス回帰手法を提案します。
まず、境界ボックスの回帰特性を分析したところ、境界ボックス自体の形状とスケール係数が回帰結果に影響を与えることがわかりました。
上記の結論に基づいて、バウンディング ボックス自体の形状とスケールに焦点を当てて損失を計算し、それによってバウンディング ボックス回帰をより正確にすることができる Shape IoU 法を提案します。
最後に、多数の比較実験を通じて私たちの方法を検証しました。その結果、私たちの方法が検出パフォーマンスを効果的に向上させ、既存の方法を上回り、さまざまな検出タスクで最先端のパフォーマンスを達成できることがわかりました。コードは https:/ で入手できます。
/github.com/malagoutou/Shape-IoU
要約(オリジナル)
As an important component of the detector localization branch, bounding box regression loss plays a significant role in object detection tasks. The existing bounding box regression methods usually consider the geometric relationship between the GT box and the predicted box, and calculate the loss by using the relative position and shape of the bounding boxes, while ignoring the influence of inherent properties such as the shape and scale of the bounding boxes on bounding box regression. In order to make up for the shortcomings of existing research, this article proposes a bounding box regression method that focuses on the shape and scale of the bounding box itself. Firstly, we analyzed the regression characteristics of the bounding boxes and found that the shape and scale factors of the bounding boxes themselves will have an impact on the regression results. Based on the above conclusions, we propose the Shape IoU method, which can calculate the loss by focusing on the shape and scale of the bounding box itself, thereby making the bounding box regression more accurate. Finally, we validated our method through a large number of comparative experiments, which showed that our method can effectively improve detection performance and outperform existing methods, achieving state-of-the-art performance in different detection tasks.Code is available at https://github.com/malagoutou/Shape-IoU
arxiv情報
著者 | Hao Zhang,Shuaijie Zhang |
発行日 | 2024-01-12 15:28:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google