要約
スケルトンシーケンスはコンパクトで軽量です。
人間の行動を分類するために、多数のスケルトンベースのアクションレコグナイザーが提案されています。
この作業では、既存のモデルと互換性のあるコンポーネントを組み込み、それらの精度をさらに向上させることを目指しています。
この目的のために、離散コサイン符号化(DCE)と時系列損失(CRL)の2つの一時的なアクセサリを設計します。
DCEは、モデルが周波数領域からモーションパターンを分析するのを容易にし、その間、信号ノイズの影響を軽減します。
CRLは、シーケンスの時系列順を明示的にキャプチャするようにネットワークをガイドします。
これらの2つのコンポーネントは、最近提案された多くのアクションレコグナイザーに一貫して精度の向上をもたらし、2つの大きなベンチマークデータセット(NTU60およびNTU120)で新しい最先端(SOTA)の精度を実現します。
要約(オリジナル)
Skeleton sequences are compact and lightweight. Numerous skeleton-based action recognizers have been proposed to classify human behaviors. In this work, we aim to incorporate components that are compatible with existing models and further improve their accuracy. To this end, we design two temporal accessories: discrete cosine encoding (DCE) and chronological loss (CRL). DCE facilitates models to analyze motion patterns from the frequency domain and meanwhile alleviates the influence of signal noise. CRL guides networks to explicitly capture the sequence’s chronological order. These two components consistently endow many recently-proposed action recognizers with accuracy boosts, achieving new state-of-the-art (SOTA) accuracy on two large benchmark datasets (NTU60 and NTU120).
arxiv情報
著者 | Zhenyue Qin,Pan Ji,Dongwoo Kim,Yang Liu,Saeed Anwar,Tom Gedeon |
発行日 | 2022-06-04 05:29:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google