要約
顔の表情認識(FER)は、あいまいな顔の画像とアノテーターの主観性によって引き起こされるデータの不確実性に悩まされており、その結果、意味論的および特徴共変量シフトの問題が発生します。
既存の作品は通常、ノイズ分布を推定することによって誤ってラベル付けされたデータを修正するか、式の連想関係を無視して、クリーンなデータから学習した知識でネットワークトレーニングをガイドします。
この作業では、式の関連付けを使用して特徴分布を正規化することにより、データの不確実性からFERモデルを保護するための適応グラフベースの特徴正規化(AGFN)メソッドを提案します。
具体的には、サンプリングプロセスを介して各ミニバッチのサンプルのトポロジカルグラフを適応的に構築し、それに応じて提案されたネットワークを最適化するための座標降下戦略を設計するポアソングラフジェネレータを提案します。
私たちの方法は、ベンチマークデータセットFERPlusとRAF-DBでそれぞれ91.84%と91.11%の精度で最先端の作業を上回り、誤ってラベル付けされたデータの割合が増加すると(たとえば、20%に)、ネットワークは
既存の作品は3.38%と4.52%大幅に機能します。
要約(オリジナル)
Facial Expression Recognition (FER) suffers from data uncertainties caused by ambiguous facial images and annotators’ subjectiveness, resulting in excursive semantic and feature covariate shifting problem. Existing works usually correct mislabeled data by estimating noise distribution, or guide network training with knowledge learned from clean data, neglecting the associative relations of expressions. In this work, we propose an Adaptive Graph-based Feature Normalization (AGFN) method to protect FER models from data uncertainties by normalizing feature distributions with the association of expressions. Specifically, we propose a Poisson graph generator to adaptively construct topological graphs for samples in each mini-batches via a sampling process, and correspondingly design a coordinate descent strategy to optimize proposed network. Our method outperforms state-of-the-art works with accuracies of 91.84% and 91.11% on the benchmark datasets FERPlus and RAF-DB, respectively, and when the percentage of mislabeled data increases (e.g., to 20%), our network surpasses existing works significantly by 3.38% and 4.52%.
arxiv情報
著者 | Yangtao Du,Qingqing Wang,Yujie Xiong |
発行日 | 2022-07-22 14:57:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google