Adaptive Algorithms for Relaxed Pareto Set Identification

要約

本稿では、多目的多腕バンディットモデルにおけるパレート最適集合の固定信頼度同定を再検討する。正確なパレート集合を同定するためのサンプルの複雑さは非常に大きくなる可能性があるため、いくつかの追加的な最適に近い腕を出力することを可能にする緩和が研究されてきた。本研究では、パレート集合の関連する部分集合を同定することを可能にする代替緩和にも取り組む。注目すべきは、パレート集合同定問題の異なる緩和を考慮するために、異なる停止規則と組み合わせて使用できる、適応的パレート探索と呼ばれる単一のサンプリング戦略を提案することである。我々は、これらの異なる組み合わせのサンプルの複雑さを解析し、特に、最大$k$のパレート最適腕を同定しようとする場合に生じるサンプルの複雑さの減少を定量化する。複数の免疫原性基準を考慮した場合に最適なものを見つけるために、Covid-19に対するいくつかのワクチン接種戦略を適応的に探索する。

要約(オリジナル)

In this paper we revisit the fixed-confidence identification of the Pareto optimal set in a multi-objective multi-armed bandit model. As the sample complexity to identify the exact Pareto set can be very large, a relaxation allowing to output some additional near-optimal arms has been studied. In this work we also tackle alternative relaxations that allow instead to identify a relevant subset of the Pareto set. Notably, we propose a single sampling strategy, called Adaptive Pareto Exploration, that can be used in conjunction with different stopping rules to take into account different relaxations of the Pareto Set Identification problem. We analyze the sample complexity of these different combinations, quantifying in particular the reduction in sample complexity that occurs when one seeks to identify at most $k$ Pareto optimal arms. We showcase the good practical performance of Adaptive Pareto Exploration on a real-world scenario, in which we adaptively explore several vaccination strategies against Covid-19 in order to find the optimal ones when multiple immunogenicity criteria are taken into account.

arxiv情報

著者 Cyrille Kone,Emilie Kaufmann,Laura Richert
発行日 2023-11-03 15:28:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 68T05, cs.LG, stat.ML パーマリンク