Multitask Learning with No Regret: from Improved Confidence Bounds to Active Learning

要約

マルチタスク学習は、複数のタスク間で情報を共有することにより、関連する複数のタスクを同時に学習することを可能にする強力なフレームワークである。推定されたタスクの不確実性を定量化することは、オンライン学習や能動学習など、多くの下流アプリケーションにとって極めて重要である。本研究では、タスク間の類似度もタスクの特徴も学習者が利用できないような、困難な不可知論的設定において、新しいマルチタスク信頼区間を提供する。得られた信頼区間はi.i.d.データを必要とせず、オンライン学習における後悔を抑制するために直接適用することができる。マルチタスク情報利得の精緻な解析により、タスクの類似度パラメータに応じて、タスクを独立に扱うよりも大幅に改善できる新しい後悔保証を得る。さらに、このような改善された後悔を、このパラメータを事前に知ることなく、すなわちタスクの類似性に自動的に適応することなく達成する、新しいオンライン学習アルゴリズムを提案する。我々の成果の第二の応用として、複数のタスクを同時に最適化しなければならないが、各ラウンドで学習者がフィードバックを求めることができるのはそのうちの1つだけであるという、新しいマルチタスク能動学習設定を導入する。この問題に対して、信頼区間を用いて、どのタスクに問い合わせを行うかを決定する、後悔のないアルゴリズムを設計する。最後に、我々の境界とアルゴリズムを、合成データと実データ(創薬データ)を用いて実証的に検証する。

要約(オリジナル)

Multitask learning is a powerful framework that enables one to simultaneously learn multiple related tasks by sharing information between them. Quantifying uncertainty in the estimated tasks is of pivotal importance for many downstream applications, such as online or active learning. In this work, we provide novel multitask confidence intervals in the challenging agnostic setting, i.e., when neither the similarity between tasks nor the tasks’ features are available to the learner. The obtained intervals do not require i.i.d. data and can be directly applied to bound the regret in online learning. Through a refined analysis of the multitask information gain, we obtain new regret guarantees that, depending on a task similarity parameter, can significantly improve over treating tasks independently. We further propose a novel online learning algorithm that achieves such improved regret without knowing this parameter in advance, i.e., automatically adapting to task similarity. As a second key application of our results, we introduce a novel multitask active learning setup where several tasks must be simultaneously optimized, but only one of them can be queried for feedback by the learner at each round. For this problem, we design a no-regret algorithm that uses our confidence intervals to decide which task should be queried. Finally, we empirically validate our bounds and algorithms on synthetic and real-world (drug discovery) data.

arxiv情報

著者 Pier Giuseppe Sessa,Pierre Laforgue,Nicolò Cesa-Bianchi,Andreas Krause
発行日 2023-08-03 13:08:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG パーマリンク