要約
単一点監視を使用したオブジェクト検出は、長年にわたって注目を集めてきました。
ただし、点監視オブジェクト検出 (PSOD) と境界ボックス監視検出の間のパフォーマンス ギャップは依然として大きいままです。
このホワイト ペーパーでは、このような大きなパフォーマンス ギャップは、複数インスタンス学習 (MIL) にとって重要な高品質のプロポーザル バッグの生成の失敗に起因すると考えています。
この問題に対処するために、既製の提案 (OTSP) メソッドに軽量な代替手段を導入し、それによって Point-to-Box Network (P2BNet) を作成します。
アンカーのような方法。
正確な位置情報を十分に調査することにより、P2BNet はインスタンス レベルのバッグをさらに構築し、複数のオブジェクトの混合を回避します。
最後に、プロポーザルとグラウンド トゥルース (GT) の間の IoU を改善するために、カスケード方式の粗いポリシーから細かいポリシーへのポリシーが使用されます。
これらの戦略の恩恵を受けて、P2BNet はオブジェクト検出用の高品質のインスタンス レベルのバッグを生成できます。
P2BNet は、MS COCO データセットに対する以前の最良の PSOD メソッドと比較して、平均精度 (AP) を 50% 以上改善します。
また、点監視検出器とバウンディング ボックス監視検出器の間のパフォーマンス ギャップを埋める大きな可能性も示しています。
コードは github.com/ucas-vg/P2BNet でリリースされます。
要約(オリジナル)
Object detection using single point supervision has received increasing attention over the years. However, the performance gap between point supervised object detection (PSOD) and bounding box supervised detection remains large. In this paper, we attribute such a large performance gap to the failure of generating high-quality proposal bags which are crucial for multiple instance learning (MIL). To address this problem, we introduce a lightweight alternative to the off-the-shelf proposal (OTSP) method and thereby create the Point-to-Box Network (P2BNet), which can construct an inter-objects balanced proposal bag by generating proposals in an anchor-like way. By fully investigating the accurate position information, P2BNet further constructs an instance-level bag, avoiding the mixture of multiple objects. Finally, a coarse-to-fine policy in a cascade fashion is utilized to improve the IoU between proposals and ground-truth (GT). Benefiting from these strategies, P2BNet is able to produce high-quality instance-level bags for object detection. P2BNet improves the mean average precision (AP) by more than 50% relative to the previous best PSOD method on the MS COCO dataset. It also demonstrates the great potential to bridge the performance gap between point supervised and bounding-box supervised detectors. The code will be released at github.com/ucas-vg/P2BNet.
arxiv情報
著者 | Pengfei Chen,Xuehui Yu,Xumeng Han,Najmul Hassan,Kai Wang,Jiachen Li,Jian Zhao,Humphrey Shi,Zhenjun Han,Qixiang Ye |
発行日 | 2022-10-20 15:28:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google