要約
分布外検出の鍵は、分布内データまたはその特徴表現の密度推定です。
これは、分布内データが複雑な基礎構造を持つドメインでの高密度の異常検出では特に困難です。
最近傍アプローチは、工業検査や画像分類などのオブジェクト中心のデータ領域でうまく機能することが示されています。
この論文では、最近傍アプローチが、適切な特徴表現を使用した場合、複雑な運転シーンにおける高密度の新規性検出において最先端の結果も得られることを示します。
特に、トランスフォーマーベースのアーキテクチャは、タスクのより優れた類似性メトリックを生成する表現を生成することがわかりました。
私たちはこれらのモデルのマルチヘッド構造が理由の 1 つであることを特定し、改良点の一部を CNN に移す方法を示します。
最終的に、このアプローチはシンプルで非侵襲的です。つまり、主要なセグメンテーションのパフォーマンスに影響を与えず、異常の例に関するトレーニングを控え、RoadAnomaly、StreetHazards、および SegmentMeIfYouCan-Anomaly に関して最先端の結果を達成します。
要約(オリジナル)
The key to out-of-distribution detection is density estimation of the in-distribution data or of its feature representations. This is particularly challenging for dense anomaly detection in domains where the in-distribution data has a complex underlying structure. Nearest-Neighbors approaches have been shown to work well in object-centric data domains, such as industrial inspection and image classification. In this paper, we show that nearest-neighbor approaches also yield state-of-the-art results on dense novelty detection in complex driving scenes when working with an appropriate feature representation. In particular, we find that transformer-based architectures produce representations that yield much better similarity metrics for the task. We identify the multi-head structure of these models as one of the reasons, and demonstrate a way to transfer some of the improvements to CNNs. Ultimately, the approach is simple and non-invasive, i.e., it does not affect the primary segmentation performance, refrains from training on examples of anomalies, and achieves state-of-the-art results on RoadAnomaly, StreetHazards, and SegmentMeIfYouCan-Anomaly.
arxiv情報
著者 | Silvio Galesso,Max Argus,Thomas Brox |
発行日 | 2023-09-14 13:13:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google