要約
弱教師付きオブジェクト検出 (WSOD) は、画像レベルの注釈のみでトレーニングされたモデルを使用して、画像内のオブジェクトを検出するタスクです。
現在の最先端のモデルは、自己管理型のインスタンス レベルの監視の恩恵を受けていますが、弱い監視にはカウントや位置情報が含まれていないため、最も一般的な「argmax」ラベル付け方法では、オブジェクトの多くのインスタンスが無視されることがよくあります。
この問題を軽減するために、オブジェクト検出と呼ばれる新しい複数インスタンスのラベル付け方法を提案します。
さらに、インスタンス レベルの情報がサンプリングに使用できない弱い監視下での新しいコントラスト損失を導入します。これは、弱い監視下のコントラスト損失 (WSCL) と呼ばれます。
WSCL は、同じクラスにベクトルを埋め込むための一貫した機能を活用することにより、オブジェクト検出のための信頼できる類似性のしきい値を構築することを目的としています。
その結果、MS-COCO 2014 および 2017 と PASCAL VOC 2012 で最先端の結果を達成し、PASCAL VOC 2007 で競争力のある結果を達成しました。
要約(オリジナル)
Weakly Supervised Object Detection (WSOD) is a task that detects objects in an image using a model trained only on image-level annotations. Current state-of-the-art models benefit from self-supervised instance-level supervision, but since weak supervision does not include count or location information, the most common “argmax” labeling method often ignores many instances of objects. To alleviate this issue, we propose a novel multiple instance labeling method called object discovery. We further introduce a new contrastive loss under weak supervision where no instance-level information is available for sampling, called weakly supervised contrastive loss (WSCL). WSCL aims to construct a credible similarity threshold for object discovery by leveraging consistent features for embedding vectors in the same class. As a result, we achieve new state-of-the-art results on MS-COCO 2014 and 2017 as well as PASCAL VOC 2012, and competitive results on PASCAL VOC 2007.
arxiv情報
著者 | Jinhwan Seo,Wonho Bae,Danica J. Sutherland,Junhyug Noh,Daijin Kim |
発行日 | 2022-08-16 07:36:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google