Few Shot Part Segmentation Reveals Compositional Logic for Industrial Anomaly Detection

要約

論理異常 (LA) とは、画像内のコンポーネントの量、配置、構成など、基礎となる論理制約に違反するデータを指します。
このような異常を正確に検出するには、モデルがセグメンテーションを通じてさまざまなコンポーネント タイプを推論する必要があります。
ただし、セマンティック セグメンテーション用のピクセル レベルのアノテーションのキュレーションには、時間もコストもかかります。
これまでにも、少数ショットまたは教師なしの共同部分セグメンテーション アルゴリズムがいくつかありましたが、工業用オブジェクトを含む画像では失敗することがよくあります。
これらの画像には、同様のテクスチャと形状を持つコンポーネントが含まれており、正確に区別するのは困難であることがわかっています。
この研究では、論理的制約を共有するいくつかのラベル付きサンプルとラベルなし画像を活用する、LA 検出のための新しいコンポーネント セグメンテーション モデルを紹介します。
ラベルのない画像全体で一貫したセグメンテーションを確保するために、エントロピー損失と組み合わせてヒストグラム マッチング損失を採用します。
セグメンテーション予測は重要な役割を果たすため、クラス ヒストグラム、コンポーネント構成の埋め込み、パッチ レベルの表現という 3 つのメモリ バンクを介してビジュアル セマンティクスから重要な側面をキャプチャすることで、ローカルとグローバルの両方のサンプル有効性検出を強化することを提案します。
効果的な LA 検出のために、推論におけるさまざまなメモリ バンクからの異常スコアを標準化する適応スケーリング戦略を提案します。
公開ベンチマーク MVTec LOCO AD での広範な実験により、LA 検出において当社の手法が 98.1% の AUROC を達成するのに対し、競合手法の 89.6% が達成されることが明らかになりました。

要約(オリジナル)

Logical anomalies (LA) refer to data violating underlying logical constraints e.g., the quantity, arrangement, or composition of components within an image. Detecting accurately such anomalies requires models to reason about various component types through segmentation. However, curation of pixel-level annotations for semantic segmentation is both time-consuming and expensive. Although there are some prior few-shot or unsupervised co-part segmentation algorithms, they often fail on images with industrial object. These images have components with similar textures and shapes, and a precise differentiation proves challenging. In this study, we introduce a novel component segmentation model for LA detection that leverages a few labeled samples and unlabeled images sharing logical constraints. To ensure consistent segmentation across unlabeled images, we employ a histogram matching loss in conjunction with an entropy loss. As segmentation predictions play a crucial role, we propose to enhance both local and global sample validity detection by capturing key aspects from visual semantics via three memory banks: class histograms, component composition embeddings and patch-level representations. For effective LA detection, we propose an adaptive scaling strategy to standardize anomaly scores from different memory banks in inference. Extensive experiments on the public benchmark MVTec LOCO AD reveal our method achieves 98.1% AUROC in LA detection vs. 89.6% from competing methods.

arxiv情報

著者 Soopil Kim,Sion An,Philip Chikontwe,Myeongkyun Kang,Ehsan Adeli,Kilian M. Pohl,Sanghyun Park
発行日 2023-12-21 12:14:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク