IPAD: Industrial Process Anomaly Detection Dataset

要約

ビデオ異常検出 (VAD) は、ビデオ フレームの異常を認識することを目的とした困難なタスクであり、既存の大規模 VAD 研究は主に道路交通と人間の活動シーンに焦点を当てています。
産業現場では、さまざまな予測不可能な異常が発生することが多く、VAD 手法はこれらのシナリオで重要な役割を果たします。
ただし、プライバシーとセキュリティに関する懸念のため、工業生産シナリオに特化して調整された適用可能なデータセットや手法が不足しています。
このギャップを埋めるために、産業シナリオにおける VAD 用に特別に設計された新しいデータセット IPAD を提案します。
データセット内の産業プロセスは、現場での工場調査とエンジニアとのディスカッションを通じて選択されています。
このデータセットは 16 の異なる産業用デバイスをカバーしており、6 時間以上の合成ビデオ映像と現実世界のビデオ映像が含まれています。
さらに、産業プロセスの重要な特徴、つまり周期性についても注釈を付けます。
提案されたデータセットに基づいて、基本的な再構成モデ​​ル内の周期情報を効果的に調査するために、周期メモリモジュールとスライディングウィンドウ検査メカニズムを導入します。
私たちのフレームワークは LoRA アダプターを活用して、最初は合成データを使用してトレーニングされた事前トレーニング済みモデルを現実世界のシナリオに効果的に移行する方法を検討します。
私たちが提案するデータセットと手法は、産業用ビデオ異常検出の分野におけるギャップを埋め、ビデオ理解タスクのプロセスとスマートファクトリー展開を推進します。

要約(オリジナル)

Video anomaly detection (VAD) is a challenging task aiming to recognize anomalies in video frames, and existing large-scale VAD researches primarily focus on road traffic and human activity scenes. In industrial scenes, there are often a variety of unpredictable anomalies, and the VAD method can play a significant role in these scenarios. However, there is a lack of applicable datasets and methods specifically tailored for industrial production scenarios due to concerns regarding privacy and security. To bridge this gap, we propose a new dataset, IPAD, specifically designed for VAD in industrial scenarios. The industrial processes in our dataset are chosen through on-site factory research and discussions with engineers. This dataset covers 16 different industrial devices and contains over 6 hours of both synthetic and real-world video footage. Moreover, we annotate the key feature of the industrial process, ie, periodicity. Based on the proposed dataset, we introduce a period memory module and a sliding window inspection mechanism to effectively investigate the periodic information in a basic reconstruction model. Our framework leverages LoRA adapter to explore the effective migration of pretrained models, which are initially trained using synthetic data, into real-world scenarios. Our proposed dataset and method will fill the gap in the field of industrial video anomaly detection and drive the process of video understanding tasks as well as smart factory deployment.

arxiv情報

著者 Jinfan Liu,Yichao Yan,Junjie Li,Weiming Zhao,Pengzhi Chu,Xingdong Sheng,Yunhui Liu,Xiaokang Yang
発行日 2024-04-23 13:38:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク