要約
外れ値の検出は、監視付き視覚認識の安全性が重要なアプリケーションでは不可欠な機能です。
既存の手法のほとんどは、標準的な閉集合モデルが負のトレーニング データで信頼性の低い予測を生成することを奨励することで、最良の結果をもたらします。
しかし、このアプローチでは、予測の不確実性とネガティブクラスの認識が混同されます。
したがって、K 個のグラウンドトゥルース クラスと 1 個の外れ値クラスに対応する K+1 ロジットの直接予測を再考します。
この設定により、分布内不確実性と負の客観性と呼ぶ外れ値クラスの事後分布のアンサンブルとして新しい異常スコアを定式化することができます。
i) 予測の不確実性が高い、または ii) ネガティブなデータとの類似性により、外れ値を独立して検出できるようになりました。
K+2 クラスにわたるマスクレベルの認識を備えた高密度予測アーキテクチャにメソッドを埋め込みます。
この訓練手順は、新規の K+2 番目のクラスが、貼り付けられた否定的なインスタンスで否定的な対象性を学習することを奨励します。
当社のモデルは、実際のネガティブ データでのトレーニングの有無にかかわらず、画像全体およびピクセル レベルの外れ値検出の標準ベンチマークで現在の最先端のパフォーマンスを上回ります。
要約(オリジナル)
Outlier detection is an essential capability in safety-critical applications of supervised visual recognition. Most of the existing methods deliver best results by encouraging standard closed-set models to produce low-confidence predictions in negative training data. However, that approach conflates prediction uncertainty with recognition of the negative class. We therefore reconsider direct prediction of K+1 logits that correspond to K groundtruth classes and one outlier class. This setup allows us to formulate a novel anomaly score as an ensemble of in-distribution uncertainty and the posterior of the outlier class which we term negative objectness. Now outliers can be independently detected due to i) high prediction uncertainty or ii) similarity with negative data. We embed our method into a dense prediction architecture with mask-level recognition over K+2 classes. The training procedure encourages the novel K+2-th class to learn negative objectness at pasted negative instances. Our models outperform the current state-of-the art on standard benchmarks for image-wide and pixel-level outlier detection with and without training on real negative data.
arxiv情報
著者 | Anja Delić,Matej Grcić,Siniša Šegvić |
発行日 | 2024-02-23 15:19:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google