CALICO: Confident Active Learning with Integrated Calibration

要約

医療画像などの安全性が重要なアプリケーションでディープラーニングの使用が増加していることにより、限定されたラベル付きデータに対する懸念が生じています。モデルの複雑さが増すにつれてこの需要は増大し、分野の専門家がデータに注釈を付ける際のハードルが生じています。
これに対応して、アクティブ ラーニング (AL) を使用して、限られたアノテーション コストでモデルを効率的にトレーニングします。
ディープ ニューラル ネットワーク (DNN) のコンテキストでは、AL は多くの場合、最も有益なサンプルを選択するためのスコアとして信頼度または確率の出力を使用します。
ただし、最新の DNN は信頼性の低い出力を示すため、キャリブレーションが不可欠です。
我々は、トレーニングプロセス中のサンプル選択に使用される信頼度を自己調整する AL フレームワークを提案します。 これは、統合キャリブレーションによる自信型アクティブ学習 (CALICO) と呼ばれます。
CALICO には、標準のソフトマックス ベースの分類器の代わりに、分類器とエネルギー ベースのモデルの共同トレーニングが組み込まれています。
このアプローチにより、トレーニング中に入力データの分布とクラス確率を同時に推定できるため、追加のラベル付きデータセットを必要とせずにキャリブレーションが向上します。
実験結果では、ラベル付きサンプルが少ないソフトマックス ベースの分類器と比較して、分類パフォーマンスが向上していることが示されています。
さらに、モデルのキャリブレーションの安定性は、データの以前のクラスの分布に依存することが観察されます。

要約(オリジナル)

The growing use of deep learning in safety-critical applications, such as medical imaging, has raised concerns about limited labeled data, where this demand is amplified as model complexity increases, posing hurdles for domain experts to annotate data. In response to this, active learning (AL) is used to efficiently train models with limited annotation costs. In the context of deep neural networks (DNNs), AL often uses confidence or probability outputs as a score for selecting the most informative samples. However, modern DNNs exhibit unreliable confidence outputs, making calibration essential. We propose an AL framework that self-calibrates the confidence used for sample selection during the training process, referred to as Confident Active Learning with Integrated CalibratiOn (CALICO). CALICO incorporates the joint training of a classifier and an energy-based model, instead of the standard softmax-based classifier. This approach allows for simultaneous estimation of the input data distribution and the class probabilities during training, improving calibration without needing an additional labeled dataset. Experimental results showcase improved classification performance compared to a softmax-based classifier with fewer labeled samples. Furthermore, the calibration stability of the model is observed to depend on the prior class distribution of the data.

arxiv情報

著者 Lorenzo S. Querol,Hajime Nagahara,Hideaki Hayashi
発行日 2024-07-02 15:05:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク