Prompt-Guided Zero-Shot Anomaly Action Recognition using Pretrained Deep Skeleton Features

要約

この研究では、異常なサンプルを使用せずにビデオレベルの異常な人間行動イベントを教師なしで識別する教師なし異常アクション認識を調査し、同時に従来のスケルトンベースのアプローチの 3 つの制限に対処します: ターゲット ドメイン依存の DNN トレーニング、スケルトンに対するロバスト性
エラー、および正常なサンプルの欠如。
大規模なアクション認識データセットで事前トレーニングされた、ターゲットドメインに依存しないスケルトン特徴抽出器を使用して、統一されたユーザープロンプトガイドのゼロショット学習フレームワークを提示します。
特に、通常のサンプルを使用したトレーニング段階では、DNN の重みを凍結しながら通常のアクションの骨格特徴の分布をモデル化し、推論段階でこの分布を使用して異常スコアを推定します。
さらに、スケルトン エラーに対するロバスト性を高めるために、ポイント クラウド ディープ ラーニング パラダイムに着想を得た DNN アーキテクチャを導入します。
さらに、観測されていない正常な動作が異常な動作と誤認されるのを防ぐために、共通空間に配置されたユーザープロンプトの埋め込みとスケルトン機能間の類似性スコアを異常スコアに組み込み、正常な動作を間接的に補完します。
公開されている 2 つのデータセットで、上記の制限に関して提案された方法の有効性をテストするための実験を行います。

要約(オリジナル)

This study investigates unsupervised anomaly action recognition, which identifies video-level abnormal-human-behavior events in an unsupervised manner without abnormal samples, and simultaneously addresses three limitations in the conventional skeleton-based approaches: target domain-dependent DNN training, robustness against skeleton errors, and a lack of normal samples. We present a unified, user prompt-guided zero-shot learning framework using a target domain-independent skeleton feature extractor, which is pretrained on a large-scale action recognition dataset. Particularly, during the training phase using normal samples, the method models the distribution of skeleton features of the normal actions while freezing the weights of the DNNs and estimates the anomaly score using this distribution in the inference phase. Additionally, to increase robustness against skeleton errors, we introduce a DNN architecture inspired by a point cloud deep learning paradigm, which sparsely propagates the features between joints. Furthermore, to prevent the unobserved normal actions from being misidentified as abnormal actions, we incorporate a similarity score between the user prompt embeddings and skeleton features aligned in the common space into the anomaly score, which indirectly supplements normal actions. On two publicly available datasets, we conduct experiments to test the effectiveness of the proposed method with respect to abovementioned limitations.

arxiv情報

著者 Fumiaki Sato,Ryo Hachiuma,Taiki Sekii
発行日 2023-03-27 12:59:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク