Selective Multi-Scale Learning for Object Detection

要約

ピラミッド型ネットワークは、マルチスケールのオブジェクト検出の標準的な方法です。
機能ピラミッドネットワークに関する現在の研究では、通常、機能階層の特定のレベルから機能を収集するためにレイヤー接続を採用しており、それらの間の大きな違いは考慮されていません。
この問題に対処するために、選択的マルチスケール学習(SMSL)と呼ばれる機能ピラミッドネットワークのより優れたアーキテクチャを提案します。
SMSLは効率的で一般的であり、単一ステージと2ステージの両方の検出器に統合して、追加の推論コストをほとんどかけずに検出パフォーマンスを向上させることができます。
RetinaNetをSMSLと組み合わせると、COCOデータセットでAPが1.8 \%向上します(39.1 \%から40.9 \%)。
SMSLと統合すると、2ステージ検出器のAPが約1.0 \%向上します。

要約(オリジナル)

Pyramidal networks are standard methods for multi-scale object detection. Current researches on feature pyramid networks usually adopt layer connections to collect features from certain levels of the feature hierarchy, and do not consider the significant differences among them. We propose a better architecture of feature pyramid networks, named selective multi-scale learning (SMSL), to address this issue. SMSL is efficient and general, which can be integrated in both single-stage and two-stage detectors to boost detection performance, with nearly no extra inference cost. RetinaNet combined with SMSL obtains 1.8\% improvement in AP (from 39.1\% to 40.9\%) on COCO dataset. When integrated with SMSL, two-stage detectors can get around 1.0\% improvement in AP.

arxiv情報

著者 Junliang Chen,Weizeng Lu,Linlin Shen
発行日 2022-06-16 14:23:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク