Uncertainty-aware Label Distribution Learning for Facial Expression Recognition

要約

過去数年間の大幅な進歩にもかかわらず、あいまいさは依然として顔表情認識 (FER) の重要な課題です。
これにより、ノイズが多く一貫性のないアノテーションが発生する可能性があり、現実世界のシナリオでのディープ ラーニング モデルのパフォーマンスが妨げられます。
この論文では、不確実性と曖昧さに対する深いモデルのロバスト性を改善するために、新しい不確実性を意識したラベル分布学習方法を提案します。
原子価覚醒空間の近隣情報を活用して、トレーニング サンプルの感情分布を適応的に構築します。
また、提供されたラベルをラベル配布に組み込む際には、提供されたラベルの不確実性も考慮します。
私たちの方法は、深いネットワークに簡単に統合して、より多くのトレーニング監督を取得し、認識精度を向上させることができます。
さまざまなノイズの多いあいまいな設定でのいくつかのデータセットに対する集中的な実験は、私たちの方法が競争力のある結果を達成し、最近の最先端のアプローチよりも優れていることを示しています。
私たちのコードとモデルは、https://github.com/minhnhatvt/label-distribution-learning-fer-tf で入手できます。

要約(オリジナル)

Despite significant progress over the past few years, ambiguity is still a key challenge in Facial Expression Recognition (FER). It can lead to noisy and inconsistent annotation, which hinders the performance of deep learning models in real-world scenarios. In this paper, we propose a new uncertainty-aware label distribution learning method to improve the robustness of deep models against uncertainty and ambiguity. We leverage neighborhood information in the valence-arousal space to adaptively construct emotion distributions for training samples. We also consider the uncertainty of provided labels when incorporating them into the label distributions. Our method can be easily integrated into a deep network to obtain more training supervision and improve recognition accuracy. Intensive experiments on several datasets under various noisy and ambiguous settings show that our method achieves competitive results and outperforms recent state-of-the-art approaches. Our code and models are available at https://github.com/minhnhatvt/label-distribution-learning-fer-tf.

arxiv情報

著者 Nhat Le,Khanh Nguyen,Quang Tran,Erman Tjiputra,Bac Le,Anh Nguyen
発行日 2022-09-21 15:48:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク