Environment-biased Feature Ranking for Novelty Detection Robustness

要約

私たちは、堅牢な新規性検出の問題に取り組み、他の無関係な要素の変化に影響を受けずに、意味論的な内容の観点から新規性を検出することを目指しています。
具体的には、複数の環境を備えたセットアップで運用し、タスクに関連するコンテンツではなく、環境に関連した一連の機能を決定します。
したがって、事前トレーニングされた埋め込みとマルチ環境セットアップから開始し、環境に焦点を当てて機能をランク付けする方法を提案します。
まず、環境間の特徴分布の分散に基づいて特徴ごとのスコアを計算します。
次に、実際のベンチマークと合成ベンチマークの両方について、高スコアのものを削除することで、偽の相関を除去し、共分散と部分母集団シフトの両方のケースで全体のパフォーマンスを最大 6% 向上させることができたことを示します。
このタスクのために導入します。

要約(オリジナル)

We tackle the problem of robust novelty detection, where we aim to detect novelties in terms of semantic content while being invariant to changes in other, irrelevant factors. Specifically, we operate in a setup with multiple environments, where we determine the set of features that are associated more with the environments, rather than to the content relevant for the task. Thus, we propose a method that starts with a pretrained embedding and a multi-env setup and manages to rank the features based on their environment-focus. First, we compute a per-feature score based on the feature distribution variance between envs. Next, we show that by dropping the highly scored ones, we manage to remove spurious correlations and improve the overall performance by up to 6%, both in covariance and sub-population shift cases, both for a real and a synthetic benchmark, that we introduce for this task.

arxiv情報

著者 Stefan Smeu,Elena Burceanu,Emanuela Haller,Andrei Liviu Nicolicioiu
発行日 2023-09-21 17:58:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク