Algorithm Selection for Deep Active Learning with Imbalanced Datasets

要約

深層学習アプリケーションでは、ラベルの効率がますます重要な目標になっています。
アクティブ ラーニングは、ディープ ネットワークのトレーニングに必要なラベル付きサンプルの数を減らすことを目的としていますが、アクティブ ラーニング アルゴリズムの経験的なパフォーマンスは、データセットやアプリケーションによって大きく異なる可能性があります。
どのアクティブ ラーニング戦略が特定のアプリケーションでうまく機能するか、または最良のパフォーマンスを発揮するかを事前に知ることは困難です。
これに対処するために、ディープアクティブラーニングのための最初の適応アルゴリズム選択戦略を提案します。
ラベルのないデータセットについては、(メタ) アルゴリズム TAILOR (Thompson ActIve Learning algORithmselection) が一連の候補アクティブ ラーニング アルゴリズムの中から反復的かつ適応的に選択します。
TAILOR は、クラスバランスのとれたサンプルを収集することを目的とした新しい報酬関数を使用します。
マルチクラスおよびマルチラベルのアプリケーションにおける広範な実験により、候補アルゴリズムの中で最も優れたものと同等またはそれ以上の精度を達成する TAILOR の有効性が実証されています。

要約(オリジナル)

Label efficiency has become an increasingly important objective in deep learning applications. Active learning aims to reduce the number of labeled examples needed to train deep networks, but the empirical performance of active learning algorithms can vary dramatically across datasets and applications. It is difficult to know in advance which active learning strategy will perform well or best in a given application. To address this, we propose the first adaptive algorithm selection strategy for deep active learning. For any unlabeled dataset, our (meta) algorithm TAILOR (Thompson ActIve Learning algORithm selection) iteratively and adaptively chooses among a set of candidate active learning algorithms. TAILOR uses novel reward functions aimed at gathering class-balanced examples. Extensive experiments in multi-class and multi-label applications demonstrate TAILOR’s effectiveness in achieving accuracy comparable or better than that of the best of the candidate algorithms.

arxiv情報

著者 Jifan Zhang,Shuai Shao,Saurabh Verma,Robert Nowak
発行日 2023-05-26 16:22:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク