Bounding Box Stability against Feature Dropout Reflects Detector Generalization across Environments

要約

境界ボックスはオブジェクト検出を独特に特徴づけるもので、優れた検出器は対象のカテゴリの正確な境界ボックスを提供します。
ただし、テストのグラウンド トゥルースが提供されていない現実の世界では、境界ボックスが正確かどうかを確認することは自明ではないため、検出器の汎化能力を評価することができません。
この研究では、特徴マップのドロップアウトの下で、優れた検出器は位置があまり変わらない境界ボックスを出力する傾向があるのに対し、性能の悪い検出器の境界ボックスは顕著な位置変化を受けることがわかりました。
この安定性を反映するためにボックス安定性スコア (BoS スコア) を計算します。
具体的には、画像が与えられた場合、通常の境界ボックスのセットと、特徴マップのドロップアウト後の 2 番目のセットを計算します。
BoS スコアを取得するには、2 部マッチングを使用して 2 つのセット間で対応するボックスを見つけ、テスト セット全体にわたる平均 Intersection over Union (IoU) を計算します。
私たちは、BoS スコアが、さまざまなテスト環境下で平均平均精度 (mAP) によって測定される検出精度と強い正の相関関係があることの発見に貢献しました。
この関係により、車両検出や歩行者検出などの標準的な検出タスクで検証されたテストのグラウンド トゥルースにアクセスすることなく、さまざまな現実世界のテスト セットでの検出器の精度を予測できます。
コードとデータは https://github.com/YangYangGirl/BoS で入手できます。

要約(オリジナル)

Bounding boxes uniquely characterize object detection, where a good detector gives accurate bounding boxes of categories of interest. However, in the real-world where test ground truths are not provided, it is non-trivial to find out whether bounding boxes are accurate, thus preventing us from assessing the detector generalization ability. In this work, we find under feature map dropout, good detectors tend to output bounding boxes whose locations do not change much, while bounding boxes of poor detectors will undergo noticeable position changes. We compute the box stability score (BoS score) to reflect this stability. Specifically, given an image, we compute a normal set of bounding boxes and a second set after feature map dropout. To obtain BoS score, we use bipartite matching to find the corresponding boxes between the two sets and compute the average Intersection over Union (IoU) across the entire test set. We contribute to finding that BoS score has a strong, positive correlation with detection accuracy measured by mean average precision (mAP) under various test environments. This relationship allows us to predict the accuracy of detectors on various real-world test sets without accessing test ground truths, verified on canonical detection tasks such as vehicle detection and pedestrian detection. Code and data are available at https://github.com/YangYangGirl/BoS.

arxiv情報

著者 Yang Yang,Wenhai Wang,Zhe Chen,Jifeng Dai,Liang Zheng
発行日 2024-03-20 17:59:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク