要約
ビデオ内の人間の異常を検出するためのこれまでのアプローチは、通常、モデルをビデオまたはスケルトン データに直接適用する暗黙的なモデリングに依存しており、動作情報のモデリングが不正確になる可能性がありました。
この論文では、探索的研究を実施し、ビデオ異常検出のための HKVAD (Human Kinematic-inspired Video Anomaly Detection) と呼ばれる新しいアイデアを紹介します。これには、異常を検出するために人間の運動学的特徴を明示的に使用することが含まれます。
この視点の有効性と可能性を検証するために、歩行の歩幅、足のレベルでの骨格の変位、および首のレベルに特に焦点を当てて、骨格のポーズの運動学的特徴を活用するパイロット手法を提案します。
これに続いて、この方法では正規化フロー モデルを使用して密度を推定し、推定された密度に基づいて異常を検出します。
使用される運動学的特徴の数に基づいて、私たちは 3 つの簡単なバリアント手法を考案し、2 つの非常に困難な公開データセット、ShanghaiTech と UBnormal で実験を実施しました。
私たちの方法は最小限の計算リソースで良好な結果を達成し、その有効性と可能性を検証します。
要約(オリジナル)
Previous approaches to detecting human anomalies in videos have typically relied on implicit modeling by directly applying the model to video or skeleton data, potentially resulting in inaccurate modeling of motion information. In this paper, we conduct an exploratory study and introduce a new idea called HKVAD (Human Kinematic-inspired Video Anomaly Detection) for video anomaly detection, which involves the explicit use of human kinematic features to detect anomalies. To validate the effectiveness and potential of this perspective, we propose a pilot method that leverages the kinematic features of the skeleton pose, with a specific focus on the walking stride, skeleton displacement at feet level, and neck level. Following this, the method employs a normalizing flow model to estimate density and detect anomalies based on the estimated density. Based on the number of kinematic features used, we have devised three straightforward variant methods and conducted experiments on two highly challenging public datasets, ShanghaiTech and UBnormal. Our method achieves good results with minimal computational resources, validating its effectiveness and potential.
arxiv情報
著者 | Jian Xiao,Tianyuan Liu,Genlin Ji |
発行日 | 2023-09-27 13:52:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google