Logit Disagreement: OoD Detection with Bayesian Neural Networks

要約

モデルパラメーターに対する完全な後部分布を推定するベイジアンニューラルネットワーク(BNN)は、不確実性の定量化における役割と、分散除外検出(OOD)におけるその有望な応用でよく知られています。
他の不確実性測定の中でも、BNNは、相互情報の合計と予想されるエントロピーの合計として分解できる予測エントロピー(完全な不確実性)の最先端の推定を提供します。
OOD検出のコンテキストでは、予測エントロピースコアの形式での予測不確実性の推定は、同性愛および認識論の不確実性を混乱させ、後者はOODポイントの高いと仮定されています。
これらの正当化にもかかわらず、相互情報スコアは、予測エントロピーよりも悪いパフォーマンスを発揮することが示されています。
ベイジアンバリエーションオートエンコーダー(BVAE)の文献からインスピレーションを得て、この作業は、平均フィールド変動推論下でのベイジアンNNの認識論的不確実性の推定として、ロジットと呼ばれている、修正されたバージョン(ロジッツとも呼ばれます)の不一致を測定することを提案しています。
提案されている3つの認識論的不確実性スコアは、さまざまなOOD実験に関する相互情報よりも顕著な改善を示しています。
さらに、認識論的不確実性スコアは、さまざまなMNISTおよびCIFAR10実験のベイジアンベンチマーク予測エントロピーと同等の機能で機能します。

要約(オリジナル)

Bayesian neural networks (BNNs), which estimate the full posterior distribution over model parameters, are well-known for their role in uncertainty quantification and its promising application in out-of-distribution detection (OoD). Amongst other uncertainty measures, BNNs provide a state-of-the art estimation of predictive entropy (total uncertainty) which can be decomposed as the sum of mutual information and expected entropy. In the context of OoD detection the estimation of predictive uncertainty in the form of the predictive entropy score confounds aleatoric and epistemic uncertainty, the latter being hypothesized to be high for OoD points. Despite these justifications, the mutual information score has been shown to perform worse than predictive entropy. Taking inspiration from Bayesian variational autoencoder (BVAE) literature, this work proposes to measure the disagreement between a corrected version of the pre-softmax quantities, otherwise known as logits, as an estimate of epistemic uncertainty for Bayesian NNs under mean field variational inference. The three proposed epistemic uncertainty scores demonstrate marked improvements over mutual information on a range of OoD experiments, with equal performance otherwise. Moreover, the epistemic uncertainty scores perform on par with the Bayesian benchmark predictive entropy on a range of MNIST and CIFAR10 experiments.

arxiv情報

著者 Kevin Raina
発行日 2025-02-21 18:15:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, stat.ML パーマリンク