PAD: A Dataset and Benchmark for Pose-agnostic Anomaly Detection

要約

物体の異常検出はマシンビジョンの分野における重要な問題であり、最近では目覚ましい進歩が見られます。
しかし、2 つの重大な課題がその研究と応用を妨げています。
まず、既存のデータセットには、さまざまな姿勢角度からの包括的な視覚情報が不足しています。
通常、異常のないトレーニング データセットは姿勢が調整されており、テスト サンプルもトレーニング データと同じ姿勢であるという非現実的な仮定を持っています。
ただし、実際には、異常はオブジェクト上のどの領域にも存在する可能性があり、トレーニング サンプルとクエリ サンプルの姿勢が異なる可能性があるため、姿勢に依存しない異常検出の研究が必要です。
第 2 に、姿勢に依存しない異常検出の実験プロトコルに関するコンセンサスが存在しないため、さまざまな方法の不公平な比較が生じ、姿勢に依存しない異常検出に関する研究が妨げられます。
これらの問題に対処するために、私たちはマルチポーズ異常検出 (MAD) データセットとポーズ非依存型異常検出 (PAD) ベンチマークを開発します。これは、ポーズ非依存型異常検出の問題に対処するための最初のステップとなります。
具体的には、さまざまなポーズの 4K ビューと、シミュレーション環境と現実環境の両方で高品質で多様な 3D 異常を含む 20 個の複雑な形状の LEGO おもちゃを使用して MAD を構築します。
さらに、MAD を使用してトレーニングされ、ポーズに依存しない異常検出用に特別に設計された新しいメソッド OmniposeAD を提案します。
包括的な評価を通じて、データセットと手法の妥当性を実証します。
さらに、この分野での将来の研究と応用を促進するために、8 つの異常検出パラダイムをカバーするデータセットとベースライン手法を含むオープンソースのベンチマーク ライブラリを提供します。
コード、データ、モデルは https://github.com/EricLee0224/PAD で公開されています。

要約(オリジナル)

Object anomaly detection is an important problem in the field of machine vision and has seen remarkable progress recently. However, two significant challenges hinder its research and application. First, existing datasets lack comprehensive visual information from various pose angles. They usually have an unrealistic assumption that the anomaly-free training dataset is pose-aligned, and the testing samples have the same pose as the training data. However, in practice, anomaly may exist in any regions on a object, the training and query samples may have different poses, calling for the study on pose-agnostic anomaly detection. Second, the absence of a consensus on experimental protocols for pose-agnostic anomaly detection leads to unfair comparisons of different methods, hindering the research on pose-agnostic anomaly detection. To address these issues, we develop Multi-pose Anomaly Detection (MAD) dataset and Pose-agnostic Anomaly Detection (PAD) benchmark, which takes the first step to address the pose-agnostic anomaly detection problem. Specifically, we build MAD using 20 complex-shaped LEGO toys including 4K views with various poses, and high-quality and diverse 3D anomalies in both simulated and real environments. Additionally, we propose a novel method OmniposeAD, trained using MAD, specifically designed for pose-agnostic anomaly detection. Through comprehensive evaluations, we demonstrate the relevance of our dataset and method. Furthermore, we provide an open-source benchmark library, including dataset and baseline methods that cover 8 anomaly detection paradigms, to facilitate future research and application in this domain. Code, data, and models are publicly available at https://github.com/EricLee0224/PAD.

arxiv情報

著者 Qiang Zhou,Weize Li,Lihan Jiang,Guoliang Wang,Guyue Zhou,Shanghang Zhang,Hao Zhao
発行日 2023-10-11 17:59:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク