Anomalies by Synthesis: Anomaly Detection using Generative Diffusion Models for Off-Road Navigation

要約

オフロードおよび非構造化されていない環境で安全かつ確実にナビゲートするために、ロボットはトレーニングデータに関して分散型(OOD)の異常を検出する必要があります。
OODデータの性質について仮定することなく、ピクセルごとの異常検出の分析ごとのアプローチを提示します。
入力画像が与えられた場合、生成的拡散モデルを使用して、残りの画像を変更せずに異常を削除する編集された画像を合成します。
次に、拡散モデルによってどの画像セグメントが変更されたかを分析する際に、異常検出を定式化します。
理想的なガイダンス勾配を分析し、拡散モデルをブートストラップしてガイダンス勾配を予測する原則的な近似を導き出すことにより、誘導拡散のための新しい推論アプローチを提案します。
編集手法は、再訓練や微調整を必要とせずに既存のワークフローに統合できる純粋にテスト時間です。
最後に、Vision-Language Foundationモデルの組み合わせを使用して、学習された機能空間のピクセルを比較し、意味的に意味のある編集を検出し、オフロードナビゲーションの正確な異常検出を可能にします。
プロジェクトのウェブサイト:https://siddancha.github.io/anomalies-by-diffusion-synthesis/

要約(オリジナル)

In order to navigate safely and reliably in off-road and unstructured environments, robots must detect anomalies that are out-of-distribution (OOD) with respect to the training data. We present an analysis-by-synthesis approach for pixel-wise anomaly detection without making any assumptions about the nature of OOD data. Given an input image, we use a generative diffusion model to synthesize an edited image that removes anomalies while keeping the remaining image unchanged. Then, we formulate anomaly detection as analyzing which image segments were modified by the diffusion model. We propose a novel inference approach for guided diffusion by analyzing the ideal guidance gradient and deriving a principled approximation that bootstraps the diffusion model to predict guidance gradients. Our editing technique is purely test-time that can be integrated into existing workflows without the need for retraining or fine-tuning. Finally, we use a combination of vision-language foundation models to compare pixels in a learned feature space and detect semantically meaningful edits, enabling accurate anomaly detection for off-road navigation. Project website: https://siddancha.github.io/anomalies-by-diffusion-synthesis/

arxiv情報

著者 Siddharth Ancha,Sunshine Jiang,Travis Manderson,Laura Brandt,Yilun Du,Philip R. Osteen,Nicholas Roy
発行日 2025-05-28 19:26:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク