要約
専門家のフィードバックのために有益なデータ ポイントを選択すると、医療診断や不正検出など、さまざまな状況で異常検出 (AD) のパフォーマンスを大幅に向上させることができます。
このホワイトペーパーでは、異常スコアがラベル付きクエリからラベルなしデータに一般化される一連の理論的条件を決定します。
これらの結果に動機付けられて、ラベリング予算の制約の下で最適なデータ カバレッジを持つデータ ラベリング戦略を提案します。
さらに、半教師あり AD の新しい学習フレームワークを提案します。
画像、表形式、ビデオのデータセットに関する広範な実験により、私たちのアプローチにより、ラベリング予算の制約の下で最先端の半教師付き AD パフォーマンスが得られることが示されました。
要約(オリジナル)
Selecting informative data points for expert feedback can significantly improve the performance of anomaly detection (AD) in various contexts, such as medical diagnostics or fraud detection. In this paper, we determine a set of theoretical conditions under which anomaly scores generalize from labeled queries to unlabeled data. Motivated by these results, we propose a data labeling strategy with optimal data coverage under labeling budget constraints. In addition, we propose a new learning framework for semi-supervised AD. Extensive experiments on image, tabular, and video data sets show that our approach results in state-of-the-art semi-supervised AD performance under labeling budget constraints.
arxiv情報
著者 | Aodong Li,Chen Qiu,Padhraic Smyth,Marius Kloft,Stephan Mandt,Maja Rudolph |
発行日 | 2023-02-15 18:18:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google