Mini-ResEmoteNet: Leveraging Knowledge Distillation for Human-Centered Design

要約

顔の感情認識は、ユーザーエクスペリエンスのドメイン、特に最新のユーザビリティテストで、ユーザーの満足度とエンゲージメントのより深い理解を促進するため、ますます極めて重要になっています。
この研究の目的は、知識蒸留フレームワークを採用してミニレモテネットモデル(軽量学生モデル)を使用して、ユーザビリティテストに合わせて調整することにより、remotenetモデルを拡張することを目的としています。
実験はFER2013およびRAF-DBデータセットで実施され、3つの学生モデルアーキテクチャの有効性を評価しました:学生モデルA、学生モデルB、および学生モデルCは、教師モデルの各層の特徴チャネルの数を減らすことを伴います。
約50%、75%、87.5%。
FER2013データセットで並外れたパフォーマンスを実証する学生モデルA(E1)は、76.33%のテスト精度を達成し、Emonextよりも0.21%の絶対改善を示しました。
さらに、結果は、remotenetモデルと比較して、推論中の推論速度とメモリの使用に関して絶対的な改善を示します。
調査結果は、提案された方法が他の最先端のアプローチを上回ることを示しています。

要約(オリジナル)

Facial Emotion Recognition has emerged as increasingly pivotal in the domain of User Experience, notably within modern usability testing, as it facilitates a deeper comprehension of user satisfaction and engagement. This study aims to extend the ResEmoteNet model by employing a knowledge distillation framework to develop Mini-ResEmoteNet models – lightweight student models – tailored for usability testing. Experiments were conducted on the FER2013 and RAF-DB datasets to assess the efficacy of three student model architectures: Student Model A, Student Model B, and Student Model C. Their development involves reducing the number of feature channels in each layer of the teacher model by approximately 50%, 75%, and 87.5%. Demonstrating exceptional performance on the FER2013 dataset, Student Model A (E1) achieved a test accuracy of 76.33%, marking a 0.21% absolute improvement over EmoNeXt. Moreover, the results exhibit absolute improvements in terms of inference speed and memory usage during inference compared to the ResEmoteNet model. The findings indicate that the proposed methods surpass other state-of-the-art approaches.

arxiv情報

著者 Amna Murtada,Omnia Abdelrhman,Tahani Abdalla Attia
発行日 2025-01-30 18:06:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク