Birds of a Feather Trust Together: Knowing When to Trust a Classifier via Adaptive Neighborhood Aggregation

要約

分類器による予測がいつ信頼できるかを知るにはどうすればよいでしょうか?
これは根本的な問題であり、特に医療や自動運転などの安全性が重要な分野では、非常に実用的です。
分類子のソフトマックス出力を信頼性の代用として使用するという事実上のアプローチには、過信の問題があります。
最新の研究では、追加の再トレーニング コストや精度と信頼性のトレードオフなどの問題が発生します。
この作業では、サンプルに対する分類器の予測の信頼性は、サンプルの近傍情報と分類器の出力という 2 つの要因と強く関連していると主張します。
両方の長所を組み合わせるために、モデルにとらわれないポストホック アプローチ NeighborAgg を設計し、適応型近隣アグリゲーションを介して 2 つの重要な情報を活用します。
理論的には、NeighborAgg が 1 ホップ グラフ畳み込みネットワークの一般化されたバージョンであり、各クラス内のサンプル間のさまざまな類似性をキャプチャする強力なモデリング機能を継承していることを示します。
また、密接に関連するミスラベル検出のタスクにアプローチを拡張し、偽陰性を制限するための理論的なカバレッジ保証を提供します。
経験的に、画像と表形式のベンチマークに関する広範な実験により、私たちの理論が検証され、NeighborAgg が他の方法よりも優れており、最先端の信頼性パフォーマンスを達成することが示唆されています。

要約(オリジナル)

How do we know when the predictions made by a classifier can be trusted? This is a fundamental problem that also has immense practical applicability, especially in safety-critical areas such as medicine and autonomous driving. The de facto approach of using the classifier’s softmax outputs as a proxy for trustworthiness suffers from the over-confidence issue; while the most recent works incur problems such as additional retraining cost and accuracy versus trustworthiness trade-off. In this work, we argue that the trustworthiness of a classifier’s prediction for a sample is highly associated with two factors: the sample’s neighborhood information and the classifier’s output. To combine the best of both worlds, we design a model-agnostic post-hoc approach NeighborAgg to leverage the two essential information via an adaptive neighborhood aggregation. Theoretically, we show that NeighborAgg is a generalized version of a one-hop graph convolutional network, inheriting the powerful modeling ability to capture the varying similarity between samples within each class. We also extend our approach to the closely related task of mislabel detection and provide a theoretical coverage guarantee to bound the false negative. Empirically, extensive experiments on image and tabular benchmarks verify our theory and suggest that NeighborAgg outperforms other methods, achieving state-of-the-art trustworthiness performance.

arxiv情報

著者 Miao Xiong,Shen Li,Wenjie Feng,Ailin Deng,Jihai Zhang,Bryan Hooi
発行日 2022-11-29 18:43:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク