DSLA: Dynamic smooth label assignment for efficient anchor-free object detection

要約

アンカーフリー検出器は、基本的にオブジェクト検出を密な分類と回帰として定式化します。
一般的なアンカーフリー検出器の場合、個々の予測ブランチを導入してローカリゼーションの品質を推定するのが一般的です。
分類と品質推定の実践を掘り下げると、次の矛盾が観察されます。
まず、完全に異なるラベルが割り当てられたいくつかの隣接するサンプルの場合、トレーニング済みモデルは同様の分類スコアを生成します。
これはトレーニングの目的に違反し、パフォーマンスの低下につながります。
第二に、より高い信頼度で検出されたバウンディング ボックスは、対応するグラウンド トゥルースとのオーバーラップが逆に小さいことがわかります。
正確にローカライズされたバウンディング ボックスは、Non-Maximum Suppression (NMS) 手順で精度の低いバウンディング ボックスによって抑制されます。
不整合の問題に対処するために、Dynamic Smooth Label Assignment (DSLA) メソッドが提案されています。
FCOSで独自に開発された中心性の概念に基づいて、スムーズな割り当て戦略が提案されます。
ラベルは [0, 1] の連続値に平滑化され、正のサンプルと負のサンプルの間で安定した遷移が行われます。
Intersection-of-Union (IoU) は、トレーニング中に動的に予測され、平滑化されたラベルと結合されます。
動的スムーズ ラベルは、分類ブランチを監視するために割り当てられます。
このような監視の下で、品質推定ブランチは自然に分類ブランチにマージされ、アンカーフリー検出器のアーキテクチャが簡素化されます。
MS COCO ベンチマークで包括的な実験が行われます。
DSLAは、アンカーのない検出器の上記の不一致を緩和することにより、検出精度を大幅に向上できることが実証されています。
コードは https://github.com/YonghaoHe/DSLA で公開されています。

要約(オリジナル)

Anchor-free detectors basically formulate object detection as dense classification and regression. For popular anchor-free detectors, it is common to introduce an individual prediction branch to estimate the quality of localization. The following inconsistencies are observed when we delve into the practices of classification and quality estimation. Firstly, for some adjacent samples which are assigned completely different labels, the trained model would produce similar classification scores. This violates the training objective and leads to performance degradation. Secondly, it is found that detected bounding boxes with higher confidences contrarily have smaller overlaps with the corresponding ground-truth. Accurately localized bounding boxes would be suppressed by less accurate ones in the Non-Maximum Suppression (NMS) procedure. To address the inconsistency problems, the Dynamic Smooth Label Assignment (DSLA) method is proposed. Based on the concept of centerness originally developed in FCOS, a smooth assignment strategy is proposed. The label is smoothed to a continuous value in [0, 1] to make a steady transition between positive and negative samples. Intersection-of-Union (IoU) is predicted dynamically during training and is coupled with the smoothed label. The dynamic smooth label is assigned to supervise the classification branch. Under such supervision, quality estimation branch is naturally merged into the classification branch, which simplifies the architecture of anchor-free detector. Comprehensive experiments are conducted on the MS COCO benchmark. It is demonstrated that, DSLA can significantly boost the detection accuracy by alleviating the above inconsistencies for anchor-free detectors. Our codes are released at https://github.com/YonghaoHe/DSLA.

arxiv情報

著者 Hu Su,Yonghao He,Jiabin Zhang,Wei Zou,Bin Fan
発行日 2022-08-01 12:56:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク