Balancing Risk and Reward: An Automated Phased Release Strategy

要約

段階的リリースは、テクノロジー業界で一般的な戦略で、一連の A/B テストを通じて新製品やアップデートを段階的にリリースし、完全な展開または非推奨になるまで処理されるユニットの数が徐々に増加します。
原則的な方法で段階的リリースを実行するには、悪影響のリスクと、実験を迅速に繰り返して学習する必要性とのバランスを考慮した方法で、新しいリリースに割り当てるユニットの割合を選択する必要があります。
この論文では、この問題を形式化し、スケジュールの各段階でリリースのパーセンテージを自動的に決定し、立ち上げ速度を最大化しながらリスク管理の必要性のバランスをとるアルゴリズムを提案します。
私たちのフレームワークは、事前に指定された実験予算が高確率で使い果たされないことを保証する、制約付きのバッチ処理されたバンディット問題としてこの課題をモデル化します。
私たちが提案するアルゴリズムは、治療に割り当てられるユニットの最大数が事後分布によって決定される適応ベイジアン アプローチを活用しており、残りの予算を使い果たす可能性が低くなります。
特に、私たちのアプローチは確率限界を反転することによってランプ サイズを分析的に解決し、困難なレアイベント モンテカルロ シミュレーションの必要性を排除します。
必要なのは結果のサブセットの平均と分散の計算のみであり、非常に効率的で並列化可能です。

要約(オリジナル)

Phased releases are a common strategy in the technology industry for gradually releasing new products or updates through a sequence of A/B tests in which the number of treated units gradually grows until full deployment or deprecation. Performing phased releases in a principled way requires selecting the proportion of units assigned to the new release in a way that balances the risk of an adverse effect with the need to iterate and learn from the experiment rapidly. In this paper, we formalize this problem and propose an algorithm that automatically determines the release percentage at each stage in the schedule, balancing the need to control risk while maximizing ramp-up speed. Our framework models the challenge as a constrained batched bandit problem that ensures that our pre-specified experimental budget is not depleted with high probability. Our proposed algorithm leverages an adaptive Bayesian approach in which the maximal number of units assigned to the treatment is determined by the posterior distribution, ensuring that the probability of depleting the remaining budget is low. Notably, our approach analytically solves the ramp sizes by inverting probability bounds, eliminating the need for challenging rare-event Monte Carlo simulation. It only requires computing means and variances of outcome subsets, making it highly efficient and parallelizable.

arxiv情報

著者 Yufan Li,Jialiang Mao,Iavor Bojinov
発行日 2023-05-16 17:27:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク