SSIVD-Net: A Novel Salient Super Image Classification & Detection Technique for Weaponized Violence

要約

閉回路テレビ (CCTV) の映像から暴力や武器を使用した暴力を検出するには、包括的なアプローチが必要です。
この研究では、\emph{Smart-City CCTV Violence Detection (SCVD)} データセットを導入します。このデータセットは、監視ビデオでの武器配布の学習を容易にするために特別に設計されています。
暴力認識タスクのための 3D 監視ビデオ分析の複雑さに取り組むために、\emph{SSIVD-Net} (\textbf{S}alient-\textbf{S}uper-\textbf{I}mage for \) と呼ばれる新しい手法を提案します。
textbf{V}iolence \textbf{D}etection)。
私たちの方法は、顕著な超画像表現を通じて推論、パフォーマンス、説明可能性を向上させながら、3D ビデオ データの複雑さ、次元性、情報損失を軽減します。
未来のスマートシティのスケーラビリティと持続可能性の要件を考慮して、著者らは、カーネル化アプローチと残差学習戦略を組み合わせた新しいアーキテクチャである \emph{Salient-Classifier} を紹介します。
SCVD データセットで SSIVD-Net と Salient Classifier のバリエーションを評価し、暴力検知で一般的に使用される最先端 (SOTA) モデルに対してベンチマークを行います。
私たちのアプローチは、武器を使用した暴力事例と非武器を使用した暴力事例の両方の検出において大幅な改善を示しています。
暴力検出における SOTA を進化させることで、私たちの取り組みは、現実世界のアプリケーションに適した実用的でスケーラブルなソリューションを提供します。
提案された方法論は、CCTV映像における暴力検出の課題に対処するだけでなく、スマート監視における武器配布の理解にも貢献します。
最終的には、私たちの研究結果により、よりスマートで安全な都市が実現し、公共の安全対策も強化されるはずです。

要約(オリジナル)

Detection of violence and weaponized violence in closed-circuit television (CCTV) footage requires a comprehensive approach. In this work, we introduce the \emph{Smart-City CCTV Violence Detection (SCVD)} dataset, specifically designed to facilitate the learning of weapon distribution in surveillance videos. To tackle the complexities of analyzing 3D surveillance video for violence recognition tasks, we propose a novel technique called \emph{SSIVD-Net} (\textbf{S}alient-\textbf{S}uper-\textbf{I}mage for \textbf{V}iolence \textbf{D}etection). Our method reduces 3D video data complexity, dimensionality, and information loss while improving inference, performance, and explainability through salient-super-Image representations. Considering the scalability and sustainability requirements of futuristic smart cities, the authors introduce the \emph{Salient-Classifier}, a novel architecture combining a kernelized approach with a residual learning strategy. We evaluate variations of SSIVD-Net and Salient Classifier on our SCVD dataset and benchmark against state-of-the-art (SOTA) models commonly employed in violence detection. Our approach exhibits significant improvements in detecting both weaponized and non-weaponized violence instances. By advancing the SOTA in violence detection, our work offers a practical and scalable solution suitable for real-world applications. The proposed methodology not only addresses the challenges of violence detection in CCTV footage but also contributes to the understanding of weapon distribution in smart surveillance. Ultimately, our research findings should enable smarter and more secure cities, as well as enhance public safety measures.

arxiv情報

著者 Toluwani Aremu,Li Zhiyuan,Reem Alameeri,Mustaqeem Khan,Abdulmotaleb El Saddik
発行日 2023-11-07 12:59:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク