要約
Swin ビジョン トランスフォーマーとスクイーズおよび励起ブロック (SE) を組み合わせて構築された、顔の感情認識フレームワークを提示します。
視覚タスクに対処するために、注意メカニズムに基づく変換モデルが最近発表されました。
私たちの方法は、Squeeze 励起ブロック (SE) とシャープネス認識最小化 (SAM) を備えたビジョン トランスフォーマーを使用します。
ハイブリッド データセットを使用してモデルをトレーニングし、AffectNet データセットを使用してモデルの結果を評価しました。
要約(オリジナル)
We present a facial emotion recognition framework, built upon Swin vision Transformers jointly with squeeze and excitation block (SE). A transformer model based on an attention mechanism has been presented recently to address vision tasks. Our method uses a vision transformer with a Squeeze excitation block (SE) and sharpness-aware minimizer (SAM). We have used a hybrid dataset, to train our model and the AffectNet dataset to evaluate the result of our model
arxiv情報
著者 | Arpita Vats,Aman Chadha |
発行日 | 2023-01-26 02:29:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google