要約
このペーパーでは、ベイジアンニューラルネットワーク(BNNS)とディープアンサンブル(DES)のモデル平均化の信用セット表現を策定するために、信用ラッパーと呼ばれる革新的なアプローチを提示し、分類タスクの不確実性の推定を改善できます。
BNNまたはDESに由来する単一の予測分布の有限コレクションを考えると、提案された信用ラッパーアプローチは、クラスごとに上限とより低い確率の境界を抽出し、限られた量の分布が利用できるため認識論的な不確実性を認めます。
クラスにわたるこのような確率間隔は、凸型の確率(クレジットセット)にマッピングでき、そこから交差点確率変換と呼ばれる変換を使用して一意の予測を取得できます。
この記事では、さまざまなデータセットペア(CIFAR10/100対SVHN/TINY-IMAGENET、CIFAR10 VS CIFAR10対CIFAR10-C、CIFAR100対CIFAR100-C、およびImagenet vs Imagenet-o)を使用してVSのネットワークを使用している、cifar100 vs cifar100-c)を含む、いくつかの分散分布(OOD)検出ベンチマークに関する広範な実験を実施します。
ResNet-18/50、EfficientNet B2、およびVITベース)。
BNNおよびDEベースラインと比較して、提案された信用ラッパー法は、不確実性の推定で優れたパフォーマンスを示し、破損したデータで予想されるキャリブレーションエラーが低いことを実現します。
要約(オリジナル)
This paper presents an innovative approach, called credal wrapper, to formulating a credal set representation of model averaging for Bayesian neural networks (BNNs) and deep ensembles (DEs), capable of improving uncertainty estimation in classification tasks. Given a finite collection of single predictive distributions derived from BNNs or DEs, the proposed credal wrapper approach extracts an upper and a lower probability bound per class, acknowledging the epistemic uncertainty due to the availability of a limited amount of distributions. Such probability intervals over classes can be mapped on a convex set of probabilities (a credal set) from which, in turn, a unique prediction can be obtained using a transformation called intersection probability transformation. In this article, we conduct extensive experiments on several out-of-distribution (OOD) detection benchmarks, encompassing various dataset pairs (CIFAR10/100 vs SVHN/Tiny-ImageNet, CIFAR10 vs CIFAR10-C, CIFAR100 vs CIFAR100-C and ImageNet vs ImageNet-O) and using different network architectures (such as VGG16, ResNet-18/50, EfficientNet B2, and ViT Base). Compared to the BNN and DE baselines, the proposed credal wrapper method exhibits superior performance in uncertainty estimation and achieves a lower expected calibration error on corrupted data.
arxiv情報
著者 | Kaizheng Wang,Fabio Cuzzolin,Keivan Shariatmadar,David Moens,Hans Hallez |
発行日 | 2025-05-09 14:56:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google