A novel method for data augmentation: Nine Dot Moving Least Square (ND-MLS)

要約

データ拡張により、ラベル付けされたデータに基づいて取得されるデータ量が大幅に増加し、データの収集とラベル付けにかかる費用と労力を節約できます。
9 ドット MLS (ND-MLS) と呼ばれるデータ拡張の新しいアプローチを紹介します。
このアプローチは、画像変形のアイデアに基づいて提案されています。
画像は、ND-MLS によって計算されたコントロール ポイントに基づいて変形されます。
この方法では、1 つの既存のデータセットに対して 2000 を超える画像を短時間で生成できます。
このデータ拡張方法を検証するために、コンピュータ ビジョンの 3 つの主なタスク、つまり分類、検出、セグメンテーションをカバーする広範なテストが実行されました。
結果は、1) 分類では、カテゴリごとに 10 枚の画像がトレーニングに使用され、VGGNet は ND-MLS による手書き数字の MNIST データセットで 92% のトップ 1 acc を取得できることを示しています。
Omniglot データセットでは、文字カテゴリが増えると通常、少数ショットの精度が低下します。
ただし、ND-MLS メソッドは安定したパフォーマンスを持ち、Res-Net で 100 の異なる手書き文字分類タスクで 96.5 のトップ 1 acc を取得します。
2) セグメンテーションでは、元の画像が 10 枚しかないという前提の下で、DeepLab はボトル、馬、および草のテスト データセットでそれぞれ 93.5%、85%、および 73.3% m_IOU(10) を取得しますが、猫のテスト データセットは 86.7% を取得します。
SegNet モデルでは m_IOU(10)。
3) オブジェクト検出の各カテゴリから 10 個の元の画像のみを使用して、YOLO v4 はそれぞれ 100% および 97.2% のボトルと馬の検出を取得しますが、猫のデータセットは YOLO v3 で 93.6% を取得します。
要約すると、ND-MLS は、わずかなデータを使用するだけで、分類、オブジェクト検出、およびセマンティック セグメンテーションのタスクを適切に実行できます。

要約(オリジナル)

Data augmentation greatly increases the amount of data obtained based on labeled data to save on expenses and labor for data collection and labeling. We present a new approach for data augmentation called nine-dot MLS (ND-MLS). This approach is proposed based on the idea of image defor-mation. Images are deformed based on control points, which are calculated by ND-MLS. The method can generate over 2000 images for one exist-ing dataset in a short time. To verify this data augmentation method, extensive tests were performed covering 3 main tasks of computer vision, namely, classification, detection and segmentation. The results show that 1) in classification, 10 images per category were used for training, and VGGNet can obtain 92% top-1 acc on the MNIST dataset of handwritten digits by ND-MLS. In the Omniglot dataset, the few-shot accuracy usu-ally decreases with the increase in character categories. However, the ND-MLS method has stable performance and obtains 96.5 top-1 acc in Res-Net on 100 different handwritten character classification tasks; 2) in segmentation, under the premise of only ten original images, DeepLab obtains 93.5%, 85%, and 73.3% m_IOU(10) on the bottle, horse, and grass test datasets, respectively, while the cat test dataset obtains 86.7% m_IOU(10) with the SegNet model; 3) with only 10 original images from each category in object detection, YOLO v4 obtains 100% and 97.2% bottle and horse detection, respectively, while the cat dataset obtains 93.6% with YOLO v3. In summary, ND-MLS can perform well on classification, object detec-tion, and semantic segmentation tasks by using only a few data.

arxiv情報

著者 Wen Yang,Rui Wang,Yanchao Zhang
発行日 2022-08-24 13:26:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク