要約
弱教師付き物体検出(WSOD)は,画像レベルのアノテーションのみを用いて学習したモデルを用いて,画像中の物体を検出するタスクである.しかし、弱い監視はカウントや位置情報を含まないため、最も一般的な「argmax」ラベリング法は、多くのオブジェクトのインスタンスを無視することが多い。この問題を軽減するために、我々はオブジェクト発見と呼ばれる新しい複数インスタンスラベリング手法を提案する。さらに、サンプリングのためにインスタンスレベルの情報が利用できない弱い監視の下での新しい対照的損失、弱い監視下対照的損失(WSCL)を導入する。WSCLは、同じクラスのベクトルを埋め込むための一貫した特徴を利用することで、オブジェクト発見のための信頼できる類似度閾値を構築することを目的としている。その結果、MS-COCO 2014と2017、およびPASCAL VOC 2012で新たに最先端の結果を達成し、PASCAL VOC 2007では競争力のある結果を得ることができました。
要約(オリジナル)
Weakly Supervised Object Detection (WSOD) is a task that detects objects in an image using a model trained only on image-level annotations. Current state-of-the-art models benefit from self-supervised instance-level supervision, but since weak supervision does not include count or location information, the most common “argmax” labeling method often ignores many instances of objects. To alleviate this issue, we propose a novel multiple instance labeling method called object discovery. We further introduce a new contrastive loss under weak supervision where no instance-level information is available for sampling, called weakly supervised contrastive loss (WSCL). WSCL aims to construct a credible similarity threshold for object discovery by leveraging consistent features for embedding vectors in the same class. As a result, we achieve new state-of-the-art results on MS-COCO 2014 and 2017 as well as PASCAL VOC 2012, and competitive results on PASCAL VOC 2007.
arxiv情報
著者 | Jinhwan Seo,Wonho Bae,Danica J. Sutherland,Junhyug Noh,Daijin Kim |
発行日 | 2022-09-02 08:53:06+00:00 |
arxivサイト | arxiv_id(pdf) |