Facial Emotion Recognition

要約

Swin ビジョン トランスフォーマーとスクイーズおよび励起ブロック (SE) を組み合わせて構築された、顔の感情認識フレームワークを提示します。
視覚タスクに対処するために、注意メカニズムに基づく変換モデルが最近発表されました。
私たちの方法は、Squeeze 励起ブロック (SE) とシャープネス認識最小化 (SAM) を備えたビジョン トランスフォーマーを使用します。
ハイブリッド データセットを使用してモデルをトレーニングし、AffectNet データセットを使用してモデルの結果を評価しました。

要約(オリジナル)

We present a facial emotion recognition framework, built upon Swin vision Transformers jointly with squeeze and excitation block (SE). A transformer model based on an attention mechanism has been presented recently to address vision tasks. Our method uses a vision transformer with a Squeeze excitation block (SE) and sharpness-aware minimizer (SAM). We have used a hybrid dataset, to train our model and the AffectNet dataset to evaluate the result of our model

arxiv情報

著者 Arpita Vats,Aman Chadha
発行日 2023-01-26 02:29:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク