Out-of-distribution Detection Learning with Unreliable Out-of-distribution Sources

要約

分布外 (OOD) 検出は、予測子が有効な予測を行うことができない OOD データを分布内 (ID) データとして識別するため、オープンワールド分類の信頼性が向上します。
ただし、ID と OOD パターンを識別できる予測変数をトレーニングするために、実際の分布外 (OOD) データを収集することは通常困難です。
この障害により、実際の OOD データを必要とせずに予測子トレーニング用のデータ ジェネレーターを介して OOD データを合成する、データ生成ベースの学習方法が誕生しました。
関連するメソッドは通常、ID データでジェネレーターを事前トレーニングし、OOD ケースである可能性が高いデータを見つけるためにさまざまな選択手順を採用します。
ただし、生成されたデータは依然として ID セマンティクスと一致する可能性があります。つまり、誤った OOD 生成が残り、ID データと OOD データの間の予測子が混乱します。
この目的を達成するために、(誤った OOD 生成を含む) 生成されたデータを使用して、実際の OOD 検出を容易にする補助 OOD 検出タスクを考案できることを提案します。
具体的には、ID 部分と OOD 部分が互いに素なサポートを持っている場合、予測子用に適切に設計されたトレーニング手順の助けを借りて、このような補助タスクからの学習が有益であることを確認できます。
したがって、誤った OOD 生成を軽減できる、補助タスクベースの OOD 学習 (ATOL) と呼ばれる強力なデータ生成ベースの学習方法を提案します。
私たちはさまざまな OOD 検出設定の下で広範な実験を実施し、先進的な対応物に対する私たちの方法の有効性を実証しています。

要約(オリジナル)

Out-of-distribution (OOD) detection discerns OOD data where the predictor cannot make valid predictions as in-distribution (ID) data, thereby increasing the reliability of open-world classification. However, it is typically hard to collect real out-of-distribution (OOD) data for training a predictor capable of discerning ID and OOD patterns. This obstacle gives rise to data generation-based learning methods, synthesizing OOD data via data generators for predictor training without requiring any real OOD data. Related methods typically pre-train a generator on ID data and adopt various selection procedures to find those data likely to be the OOD cases. However, generated data may still coincide with ID semantics, i.e., mistaken OOD generation remains, confusing the predictor between ID and OOD data. To this end, we suggest that generated data (with mistaken OOD generation) can be used to devise an auxiliary OOD detection task to facilitate real OOD detection. Specifically, we can ensure that learning from such an auxiliary task is beneficial if the ID and the OOD parts have disjoint supports, with the help of a well-designed training procedure for the predictor. Accordingly, we propose a powerful data generation-based learning method named Auxiliary Task-based OOD Learning (ATOL) that can relieve the mistaken OOD generation. We conduct extensive experiments under various OOD detection setups, demonstrating the effectiveness of our method against its advanced counterparts.

arxiv情報

著者 Haotian Zheng,Qizhou Wang,Zhen Fang,Xiaobo Xia,Feng Liu,Tongliang Liu,Bo Han
発行日 2023-11-06 16:26:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MM パーマリンク