HydraMix: Multi-Image Feature Mixing for Small Data Image Classification


ディープ ニューラル ネットワークをトレーニングするには、多数の注釈付きサンプルを含むデータセットが必要です。
これに対処するために、同じクラスの複数の異なる画像を混合することで新しい画像構成を生成する新しいアーキテクチャである HydraMix を導入します。
HydraMix は、特徴空間内のセグメンテーションベースの混合マスクによって導かれ、さまざまな画像のコンテンツの融合を学習し、教師なしトレーニングと敵対的トレーニングの組み合わせによって最適化されます。
私たちは ciFAIR-10、STL-10、ciFAIR-100 について広範な実験を行っています。
私たちの結果は、HydraMix が小規模なデータセットの画像分類において既存の最先端の方法よりも優れていることを示しています。


Training deep neural networks requires datasets with a large number of annotated examples. The collection and annotation of these datasets is not only extremely expensive but also faces legal and privacy problems. These factors are a significant limitation for many real-world applications. To address this, we introduce HydraMix, a novel architecture that generates new image compositions by mixing multiple different images from the same class. HydraMix learns the fusion of the content of various images guided by a segmentation-based mixing mask in feature space and is optimized via a combination of unsupervised and adversarial training. Our data augmentation scheme allows the creation of models trained from scratch on very small datasets. We conduct extensive experiments on ciFAIR-10, STL-10, and ciFAIR-100. Additionally, we introduce a novel text-image metric to assess the generality of the augmented datasets. Our results show that HydraMix outperforms existing state-of-the-art methods for image classification on small datasets.


著者 Christoph Reinders,Frederik Schubert,Bodo Rosenhahn
発行日 2025-01-16 12:33:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク