Looking 3D: Anomaly Detection with 2D-3D Alignment

要約

視覚的な手がかりに基づく自動異常検出は、製造や製品品質評価などのさまざまな領域で実用的な重要性を持っています。
この論文では、新しい条件付き異常検出問題を紹介します。これには、クエリ画像を参照形状と比較することによって、クエリ画像内の異常を特定することが含まれます。
この課題に対処するために、8,143 個の参照 3D 形状と組み合わせた、さまざまな異常、ジオメトリ、テクスチャを含む約 180K の画像で構成される大規模なデータセット BrokenChairs-180K を作成しました。
この課題に取り組むために、特徴の位置合わせを通じてクエリ画像と参照 3D 形状の間の対応を明示的に学習し、異常検出のためにカスタマイズされたアテンション メカニズムを活用する、新しいトランスフォーマー ベースのアプローチを提案しました。
私たちのアプローチは包括的な実験を通じて厳密に評価されており、この分野における将来の研究のベンチマークとして機能します。

要約(オリジナル)

Automatic anomaly detection based on visual cues holds practical significance in various domains, such as manufacturing and product quality assessment. This paper introduces a new conditional anomaly detection problem, which involves identifying anomalies in a query image by comparing it to a reference shape. To address this challenge, we have created a large dataset, BrokenChairs-180K, consisting of around 180K images, with diverse anomalies, geometries, and textures paired with 8,143 reference 3D shapes. To tackle this task, we have proposed a novel transformer-based approach that explicitly learns the correspondence between the query image and reference 3D shape via feature alignment and leverages a customized attention mechanism for anomaly detection. Our approach has been rigorously evaluated through comprehensive experiments, serving as a benchmark for future research in this domain.

arxiv情報

著者 Ankan Bhunia,Changjian Li,Hakan Bilen
発行日 2024-06-27 17:59:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク