要約
ビデオ異常検出の研究は通常、わずか数分の短い独立したベンチマーク ビデオで評価されます。
しかし、現実の環境では、セキュリティ カメラは一度に数か月または数年にわたって同じシーンを観察しており、異常な動作の概念は時間帯、曜日、イベントのスケジュールなどの状況に大きく依存します。
ここでは、特にこれらのシナリオを対象とした、コンテキスト認識型ビデオ異常検出アルゴリズム Trinity を提案します。
Trinity は、個人を簡単に追跡することができず、速度、方向、またはグループの動きの欠如によって異常が発生する混雑したシーンに特に適しています。
Trinity は、コンテキスト、外観、動きの間の整合性を学習することを目的とした対照的な学習フレームワークであり、整合性の品質を使用してビデオを正常か異常かを分類します。
当社では、従来のベンチマークと、3 か月以上の活動にわたって収集した公開 Web カメラベースのデータセットの両方でアルゴリズムを評価しています。
要約(オリジナル)
Video anomaly detection research is generally evaluated on short, isolated benchmark videos only a few minutes long. However, in real-world environments, security cameras observe the same scene for months or years at a time, and the notion of anomalous behavior critically depends on context, such as the time of day, day of week, or schedule of events. Here, we propose a context-aware video anomaly detection algorithm, Trinity, specifically targeted to these scenarios. Trinity is especially well-suited to crowded scenes in which individuals cannot be easily tracked, and anomalies are due to speed, direction, or absence of group motion. Trinity is a contrastive learning framework that aims to learn alignments between context, appearance, and motion, and uses alignment quality to classify videos as normal or anomalous. We evaluate our algorithm on both conventional benchmarks and a public webcam-based dataset we collected that spans more than three months of activity.
arxiv情報
著者 | Zhengye Yang,Richard Radke |
発行日 | 2024-04-11 16:17:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google