Edge Augmentation for Large-Scale Sketch Recognition without Sketches

要約

この作業では、スケッチ分類タスクを多数のカテゴリにスケールアップします。
トレーニングのためにスケッチを収集することは、これまでのところ大規模なスケッチ認識の試みを妨げる、遅くて退屈なプロセスです。
取得しやすい自然画像のラベル付きコレクションを活用することで、トレーニングスケッチデータの不足を克服します。
ドメインギャップを埋めるために、自然画像のトレーニングセットからスケッチ認識を学習するタスクに合わせた新しい拡張手法を紹介します。
ランダム化は、エッジ検出とエッジ選択のパラメーターに導入されています。
自然画像は、「ランダム化バイナリシンエッジ」(rBTE)と呼ばれる疑似新規ドメインに変換されます。これは、自然画像の代わりにトレーニングドメインとして使用されます。
スケールアップの能力は、以前に使用されたものの2.5倍以上のカテゴリのCNNベースのスケッチ認識をトレーニングすることによって実証されます。
この目的のために、874のカテゴリからの自然画像のデータセットは、多くの人気のあるコンピュータビジョンデータセットを組み合わせることによって構築されます。
カテゴリは、スケッチ認識に適したものとして選択されます。
パフォーマンスを見積もるために、スケッチを含む393のカテゴリのサブセットも収集されます。

要約(オリジナル)

This work addresses scaling up the sketch classification task into a large number of categories. Collecting sketches for training is a slow and tedious process that has so far precluded any attempts to large-scale sketch recognition. We overcome the lack of training sketch data by exploiting labeled collections of natural images that are easier to obtain. To bridge the domain gap we present a novel augmentation technique that is tailored to the task of learning sketch recognition from a training set of natural images. Randomization is introduced in the parameters of edge detection and edge selection. Natural images are translated to a pseudo-novel domain called ‘randomized Binary Thin Edges’ (rBTE), which is used as a training domain instead of natural images. The ability to scale up is demonstrated by training CNN-based sketch recognition of more than 2.5 times larger number of categories than used previously. For this purpose, a dataset of natural images from 874 categories is constructed by combining a number of popular computer vision datasets. The categories are selected to be suitable for sketch recognition. To estimate the performance, a subset of 393 categories with sketches is also collected.

arxiv情報

著者 Nikos Efthymiadis,Giorgos Tolias,Ondrej Chum
発行日 2022-06-02 18:46:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク