要約
我々は、ビデオの異常検出のための非常に高速なフレームレベルのモデルを提案します。このモデルは、複数の高精度のオブジェクトレベルの教師モデルから知識を抽出することによって異常を検出することを学習します。
生徒の忠実度を向上させるために、標準抽出と敵対的抽出を併用して教師の低解像度の異常マップを抽出し、各教師に敵対的弁別器を導入してターゲットと生成された異常マップを区別します。
私たちは 3 つのベンチマーク (Avenue、ShanghaiTech、UCSD Ped2) で実験を実施し、私たちの方法が競合する最も速い方法より 7 倍以上高速であり、オブジェクト中心モデルより 28 ~ 62 倍高速でありながら、最近の方法と同等の結果が得られることを示しています。
。
また、私たちの評価では、1480 FPS という前例のない速度により、このモデルが速度と精度の間で最良のトレードオフを達成していることも示されています。
さらに、建築設計の選択を正当化するために、包括的なアブレーション研究を実施します。
私たちのコードは https://github.com/ristea/fast-aed から無料で入手できます。
要約(オリジナル)
We propose a very fast frame-level model for anomaly detection in video, which learns to detect anomalies by distilling knowledge from multiple highly accurate object-level teacher models. To improve the fidelity of our student, we distill the low-resolution anomaly maps of the teachers by jointly applying standard and adversarial distillation, introducing an adversarial discriminator for each teacher to distinguish between target and generated anomaly maps. We conduct experiments on three benchmarks (Avenue, ShanghaiTech, UCSD Ped2), showing that our method is over 7 times faster than the fastest competing method, and between 28 and 62 times faster than object-centric models, while obtaining comparable results to recent methods. Our evaluation also indicates that our model achieves the best trade-off between speed and accuracy, due to its previously unheard-of speed of 1480 FPS. In addition, we carry out a comprehensive ablation study to justify our architectural design choices. Our code is freely available at: https://github.com/ristea/fast-aed.
arxiv情報
著者 | Florinel-Alin Croitoru,Nicolae-Catalin Ristea,Dana Dascalescu,Radu Tudor Ionescu,Fahad Shahbaz Khan,Mubarak Shah |
発行日 | 2024-07-10 16:16:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google