HydraMix: Multi-Image Feature Mixing for Small Data Image Classification

要約

ディープ ニューラル ネットワークをトレーニングするには、多数の注釈付きサンプルを含むデータセットが必要です。
これらのデータセットの収集と注釈付けには非常に費用がかかるだけでなく、法的およびプライバシーの問題にも直面します。
これらの要因は、現実世界の多くのアプリケーションにとって重大な制限となります。
これに対処するために、同じクラスの複数の異なる画像を混合することで新しい画像構成を生成する新しいアーキテクチャである HydraMix を導入します。
HydraMix は、特徴空間内のセグメンテーションベースの混合マスクによって導かれ、さまざまな画像のコンテンツの融合を学習し、教師なしトレーニングと敵対的トレーニングの組み合わせによって最適化されます。
当社のデータ拡張スキームを使用すると、非常に小さなデータセットでゼロからトレーニングされたモデルを作成できます。
私たちは ciFAIR-10、STL-10、ciFAIR-100 について広範な実験を行っています。
さらに、拡張されたデータセットの一般性を評価するための新しいテキスト画像メトリクスを導入します。
私たちの結果は、HydraMix が小規模なデータセットの画像分類において既存の最先端の方法よりも優れていることを示しています。

要約(オリジナル)

Training deep neural networks requires datasets with a large number of annotated examples. The collection and annotation of these datasets is not only extremely expensive but also faces legal and privacy problems. These factors are a significant limitation for many real-world applications. To address this, we introduce HydraMix, a novel architecture that generates new image compositions by mixing multiple different images from the same class. HydraMix learns the fusion of the content of various images guided by a segmentation-based mixing mask in feature space and is optimized via a combination of unsupervised and adversarial training. Our data augmentation scheme allows the creation of models trained from scratch on very small datasets. We conduct extensive experiments on ciFAIR-10, STL-10, and ciFAIR-100. Additionally, we introduce a novel text-image metric to assess the generality of the augmented datasets. Our results show that HydraMix outperforms existing state-of-the-art methods for image classification on small datasets.

arxiv情報

著者 Christoph Reinders,Frederik Schubert,Bodo Rosenhahn
発行日 2025-01-16 12:33:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク