要約
深層学習ソリューションの急増と、注釈付きの大規模なデータセットの不足により、現実世界のアプリケーションでは重大な課題が生じています。
この課題を克服するためにさまざまな戦略が検討されており、データ拡張 (DA) アプローチが有力なソリューションとして浮上しています。
DA アプローチには、既存のラベル付きデータを変換して追加の例を生成することが含まれます。これにより、データセットが強化され、深層学習モデルが過剰適合に屈することなく一般化の向上を達成できるようになります。
実際のアプリケーションでは、深層学習に基づくソリューションが広く使用されており、人間のコミュニケーションにおいて重要な役割を果たし、さまざまな知識分野 (医学、セキュリティ、マーケティングなど) を向上させる表情認識 (FER) があります。
この論文では、既存の 2 つのよく知られた FER データセットのターゲット タスクに対する特定のアプローチである MixAugment を含む、文献に記載されている古典的な DA アプローチを上回る、混合顔コンポーネントの正則化に基づくシンプルで包括的な顔データ拡張アプローチを提案します。
文学の中で。
要約(オリジナル)
The proliferation of deep learning solutions and the scarcity of large annotated datasets pose significant challenges in real-world applications. Various strategies have been explored to overcome this challenge, with data augmentation (DA) approaches emerging as prominent solutions. DA approaches involve generating additional examples by transforming existing labeled data, thereby enriching the dataset and helping deep learning models achieve improved generalization without succumbing to overfitting. In real applications, where solutions based on deep learning are widely used, there is facial expression recognition (FER), which plays an essential role in human communication, improving a range of knowledge areas (e.g., medicine, security, and marketing). In this paper, we propose a simple and comprehensive face data augmentation approach based on mixed face component regularization that outperforms the classical DA approaches from the literature, including the MixAugment which is a specific approach for the target task in two well-known FER datasets existing in the literature.
arxiv情報
著者 | Fabio A. Faria,Mateus M. Souza,Raoni F. da S. Teixeira,Mauricio P. Segundo |
発行日 | 2024-05-30 17:09:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google