要約
カテゴリ発見手法は、ラベルのない視覚データから新しいカテゴリを見つけることを目的としています。
トレーニング時に、ラベル付き画像とラベルなし画像のセットが提供されます。ラベルは画像内に存在するカテゴリに対応します。
ラベル付きデータは、ラベルなしデータでの検出の実行に関連する視覚的プロパティと特徴の種類を示すことで、トレーニング中にガイダンスを提供します。
その結果、ラベル付きセットに存在するカテゴリを変更すると、ラベルなしセットで最終的に発見される内容に大きな影響を与える可能性があります。
その重要性にもかかわらず、ラベル付きデータ選択の影響は、これまでのカテゴリ発見文献では調査されていません。
ラベル付きデータを変更すると、検出パフォーマンスに大きな影響を与える可能性があることを示します。
これを動機として、ラベル付きデータとラベルなしデータの類似性に基づいて、最適なラベル付きデータを自動的に選択するための 2 つの新しいアプローチを提案します。
私たちの観察によると、従来の教師あり転移学習とは異なり、最適なラベルが付けられたカテゴリは、ラベルのないカテゴリと似すぎたり、似すぎたりすることはありません。
その結果として得られたアプローチは、さまざまな困難なきめ細かいベンチマーク データセットにわたって最先端の検出パフォーマンスを実現します。
要約(オリジナル)
Category discovery methods aim to find novel categories in unlabeled visual data. At training time, a set of labeled and unlabeled images are provided, where the labels correspond to the categories present in the images. The labeled data provides guidance during training by indicating what types of visual properties and features are relevant for performing discovery in the unlabeled data. As a result, changing the categories present in the labeled set can have a large impact on what is ultimately discovered in the unlabeled set. Despite its importance, the impact of labeled data selection has not been explored in the category discovery literature to date. We show that changing the labeled data can significantly impact discovery performance. Motivated by this, we propose two new approaches for automatically selecting the most suitable labeled data based on the similarity between the labeled and unlabeled data. Our observation is that, unlike in conventional supervised transfer learning, the best labeled is neither too similar, nor too dissimilar, to the unlabeled categories. Our resulting approaches obtains state-of-the-art discovery performance across a range of challenging fine-grained benchmark datasets.
arxiv情報
著者 | Bingchen Zhao,Nico Lang,Serge Belongie,Oisin Mac Aodha |
発行日 | 2024-06-07 12:45:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google