要約
データセットの要約は、データセット検査に対する有益なアプローチです。
ただし、単一のデータセットに適用すると、視覚的な概念の発見は最も顕著なものに限定されます。
私たちは、比較アプローチによりこのパラダイムを拡張して、最も著名な概念を超えた、より豊富な形式のデータセット検査を可能にすることができると主張します。
データセットの比較を可能にするために、データセット全体で概念レベルのプロトタイプを学習するモジュールを紹介します。
私たちは自己教師あり学習を活用して、教師なしでこれらのプロトタイプを発見し、2 つのケーススタディで私たちのアプローチの利点を実証します。
私たちの調査結果は、データセットの比較によってデータセットの検査が拡張されることを示しており、この方向でのさらなる研究を奨励したいと考えています。
コードと使用手順は https://github.com/Nanne/ProtoSim で入手できます。
要約(オリジナル)
Dataset summarisation is a fruitful approach to dataset inspection. However, when applied to a single dataset the discovery of visual concepts is restricted to those most prominent. We argue that a comparative approach can expand upon this paradigm to enable richer forms of dataset inspection that go beyond the most prominent concepts. To enable dataset comparison we present a module that learns concept-level prototypes across datasets. We leverage self-supervised learning to discover these prototypes without supervision, and we demonstrate the benefits of our approach in two case-studies. Our findings show that dataset comparison extends dataset inspection and we hope to encourage more works in this direction. Code and usage instructions available at https://github.com/Nanne/ProtoSim
arxiv情報
著者 | Nanne van Noord |
発行日 | 2023-09-05 17:27:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google