Active learning with biased non-response to label requests


アクティブ ラーニングでは、取得する最も有益な新しいラベルを特定することで、予測モデルのトレーニングの効率を向上させることができます。
ただし、ラベル要求に応答しない場合は、実世界の状況におけるアクティブ ラーニングの有効性に影響を与える可能性があります。
偏った無応答の影響を軽減するために、サンプリング戦略に対するコストベースの修正、つまり期待効用の上限信頼限界 (UCB-EU) を提案します。これは、おそらくあらゆる能動学習アルゴリズムに適用できます。

ただし、特定のサンプリング方法およびデータ生成プロセスに関して、UCB-EU の下でアノテーションの非応答バイアスが依然として有害である設定も特徴付けます。
最後に、電子商取引プラットフォーム Taobao の実世界のデータセットでメソッドを評価します。
UCB-EU により、クリックされたインプレッションに基づいてトレーニングされたコンバージョン モデルのパフォーマンスが大幅に向上することがわかりました。
最も一般的には、この研究は、非応答のタイプとアクティブ ラーニングによるモデルの改善の間の相互作用をより適切に概念化することと、モデルの劣化を軽減するのに役立つ実用的で実装が簡単な修正を提供することの両方に役立ちます。


Active learning can improve the efficiency of training prediction models by identifying the most informative new labels to acquire. However, non-response to label requests can impact active learning’s effectiveness in real-world contexts. We conceptualise this degradation by considering the type of non-response present in the data, demonstrating that biased non-response is particularly detrimental to model performance. We argue that this sort of non-response is particularly likely in contexts where the labelling process, by nature, relies on user interactions. To mitigate the impact of biased non-response, we propose a cost-based correction to the sampling strategy–the Upper Confidence Bound of the Expected Utility (UCB-EU)–that can, plausibly, be applied to any active learning algorithm. Through experiments, we demonstrate that our method successfully reduces the harm from labelling non-response in many settings. However, we also characterise settings where the non-response bias in the annotations remains detrimental under UCB-EU for particular sampling methods and data generating processes. Finally, we evaluate our method on a real-world dataset from e-commerce platform Taobao. We show that UCB-EU yields substantial performance improvements to conversion models that are trained on clicked impressions. Most generally, this research serves to both better conceptualise the interplay between types of non-response and model improvements via active learning, and to provide a practical, easy to implement correction that helps mitigate model degradation.


著者 Thomas Robinson,Niek Tax,Richard Mudd,Ido Guy
発行日 2023-12-13 14:01:58+00:00
