VARS: Vision-based Assessment of Risk in Security Systems

要約

ビデオ コンテンツの危険レベルを正確に予測することは、特に迅速で信頼性の高い評価が不可欠な環境において、安全性とセキュリティ システムを強化するために重要です。
この研究では、さまざまな機械学習モデルと深層学習モデルの比較分析を実行して、それぞれ 50 フレームを含む 100 個のビデオのカスタム データセットで危険度を予測します。人間による 0 ~ 10 の範囲の危険度スコアが付けられています。
さらに、警告なし (7 未満) と警告高 (7 以上) の 3 つのカテゴリに分類されます。
私たちの評価は、サポート ベクター マシン、ニューラル ネットワーク、トランスフォーマー ベースのモデルなどの古典的な機械学習モデルを対象としています。
モデルのパフォーマンスは、精度、F1 スコア、平均絶対誤差 (MAE) などの標準的な指標を使用して評価され、結果が比較されて最も堅牢なアプローチが特定されます。
この研究は、ビデオベースのリスク検出のための、より正確で一般化可能な危険評価フレームワークの開発に貢献します。

要約(オリジナル)

The accurate prediction of danger levels in video content is critical for enhancing safety and security systems, particularly in environments where quick and reliable assessments are essential. In this study, we perform a comparative analysis of various machine learning and deep learning models to predict danger ratings in a custom dataset of 100 videos, each containing 50 frames, annotated with human-rated danger scores ranging from 0 to 10. The danger ratings are further classified into three categories: no alert (less than 7)and high alert (greater than equal to 7). Our evaluation covers classical machine learning models, such as Support Vector Machines, as well as Neural Networks, and transformer-based models. Model performance is assessed using standard metrics such as accuracy, F1-score, and mean absolute error (MAE), and the results are compared to identify the most robust approach. This research contributes to developing a more accurate and generalizable danger assessment framework for video-based risk detection.

arxiv情報

著者 Pranav Gupta,Pratham Gohil,Sridhar S
発行日 2024-10-25 15:47:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク