A Comparative Study of Image-to-Image Translation Using GANs for Synthetic Child Race Data

要約

データにおける民族的多様性の欠如は、文献における顔認識技術の制限要因となっています。
これは、データサンプルが不足している子供に特に当てはまり、大人のデータでトレーニングされたマシンビジョンアルゴリズムを子供に適用しようとする場合に課題が生じます。
この研究では、画像から画像への変換を利用してさまざまな人種のデータを合成し、それによって子供の顔データの民族性を調整することを提案しています。
私たちは民族性をスタイルとして考慮し、3 つの異なる Image-to-Image ニューラル ネットワーク ベースの手法、具体的には pix2pix、CycleGAN、および CUT ネットワークを比較して、白人の子供データとアジア人の子供データの変換を実装します。
合成データに関する実験検証結果は、画像から画像への変換手法を使用して、より広範な民族的多様性を持つさまざまな合成子データ サンプルを生成する実現可能性を示しています。

要約(オリジナル)

The lack of ethnic diversity in data has been a limiting factor of face recognition techniques in the literature. This is particularly the case for children where data samples are scarce and presents a challenge when seeking to adapt machine vision algorithms that are trained on adult data to work on children. This work proposes the utilization of image-to-image transformation to synthesize data of different races and thus adjust the ethnicity of children’s face data. We consider ethnicity as a style and compare three different Image-to-Image neural network based methods, specifically pix2pix, CycleGAN, and CUT networks to implement Caucasian child data and Asian child data conversion. Experimental validation results on synthetic data demonstrate the feasibility of using image-to-image transformation methods to generate various synthetic child data samples with broader ethnic diversity.

arxiv情報

著者 Wang Yao,Muhammad Ali Farooq,Joseph Lemley,Peter Corcoran
発行日 2023-08-08 12:54:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク