AutoAL: Automated Active Learning with Differentiable Query Strategy Search

要約

ディープラーニングが進化し続けるにつれて、データ効率の必要性がますます重要になっています。
大規模なデータセットのラベル付けには時間と費用がかかることを考慮すると、アクティブ ラーニング (AL) は、ディープ ニューラル ネットワークをトレーニングするためにサンプルの最も有益なサブセットを繰り返し選択することで、この課題に対する有望な解決策を提供し、それによってラベル付けのコストを削減します。
ただし、さまざまな AL アルゴリズムの有効性はデータ シナリオによって大きく異なる可能性があり、どの AL アルゴリズムが特定のタスクに最適であるかを判断することは依然として困難な問題です。
この研究では、既存の AL サンプリング戦略に基づいて設計された、AutoAL と呼ばれる最初の微分可能な AL 戦略検索メソッドを紹介します。
AutoAL は、SearchNet と FitNet という 2 つのニューラル ネットで構成されており、微分可能な 2 レベルの最適化フレームワークの下で同時に最適化されます。
特定のタスクに対して、SearchNet と FitNet はラベル付きデータを使用して繰り返し最適化され、一連の候補 AL アルゴリズムがそのタスクでどの程度適切に実行されるかを学習します。
最適な AL 戦略が特定されると、SearchNet はラベルのないプールから注釈をクエリするための小さなサブセットを選択し、タスク モデルの効率的なトレーニングを可能にします。
実験結果は、AutoAL が、候補となるすべての AL アルゴリズムや他の選択的 AL アプローチと比較して、一貫して優れた精度を達成していることを示しており、多様なタスクやドメインにわたって複数の既存の AL 手法を適応および統合できる可能性を示しています。
コードは https://github.com/haizailache999/AutoAL から入手できます。

要約(オリジナル)

As deep learning continues to evolve, the need for data efficiency becomes increasingly important. Considering labeling large datasets is both time-consuming and expensive, active learning (AL) provides a promising solution to this challenge by iteratively selecting the most informative subsets of examples to train deep neural networks, thereby reducing the labeling cost. However, the effectiveness of different AL algorithms can vary significantly across data scenarios, and determining which AL algorithm best fits a given task remains a challenging problem. This work presents the first differentiable AL strategy search method, named AutoAL, which is designed on top of existing AL sampling strategies. AutoAL consists of two neural nets, named SearchNet and FitNet, which are optimized concurrently under a differentiable bi-level optimization framework. For any given task, SearchNet and FitNet are iteratively co-optimized using the labeled data, learning how well a set of candidate AL algorithms perform on that task. With the optimal AL strategies identified, SearchNet selects a small subset from the unlabeled pool for querying their annotations, enabling efficient training of the task model. Experimental results demonstrate that AutoAL consistently achieves superior accuracy compared to all candidate AL algorithms and other selective AL approaches, showcasing its potential for adapting and integrating multiple existing AL methods across diverse tasks and domains. Code will be available at: https://github.com/haizailache999/AutoAL.

arxiv情報

著者 Yifeng Wang,Xueying Zhan,Siyu Huang
発行日 2024-10-17 17:59:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク