Mathematical Programming For Adaptive Experiments

要約

適応実験により統計能力を大幅に向上させることができますが、標準的なアルゴリズムでは、バッチ化された遅延フィードバック、パーソナライゼーション、非定常性、複数の目的、制約などの重要な実際的な問題が見落とされています。
これらの問題に対処するために、現在のアルゴリズム設計パラダイムは、問題のインスタンスごとに調整された方法を作成します。
すべての現実世界のインスタンスに対して新しいアルゴリズムを考案することは不可能であるため、実践者は多くの場合、すべての課題に対処できるわけではない次善の近似に頼らざるを得ません。
設定ごとにオーダーメイドのアルゴリズムを開発することから離れて、広範囲の目的、制約、統計的手順を柔軟に組み込むことができる適応実験の数理計画法を提示します。
バッチ処理された制限で動的プログラムを定式化することにより、当社のモデリング フレームワークは、スケーラブルな最適化手法 (SGD や自動微分など) を使用して治療割り当てを解決できるようにします。
私たちは、非定常性、パーソナライゼーション、複数の目的、制約などの実際的な課題をモデルにしたベンチマークに基づいてフレームワークを評価します。
トムソン サンプリングの修正版などの特注アルゴリズムとは異なり、当社の数学的プログラミング アプローチは、インスタンス全体で驚くほど堅牢なパフォーマンスを提供します。

要約(オリジナル)

Adaptive experimentation can significantly improve statistical power, but standard algorithms overlook important practical issues including batched and delayed feedback, personalization, non-stationarity, multiple objectives, and constraints. To address these issues, the current algorithm design paradigm crafts tailored methods for each problem instance. Since it is infeasible to devise novel algorithms for every real-world instance, practitioners often have to resort to suboptimal approximations that do not address all of their challenges. Moving away from developing bespoke algorithms for each setting, we present a mathematical programming view of adaptive experimentation that can flexibly incorporate a wide range of objectives, constraints, and statistical procedures. By formulating a dynamic program in the batched limit, our modeling framework enables the use of scalable optimization methods (e.g., SGD and auto-differentiation) to solve for treatment allocations. We evaluate our framework on benchmarks modeled after practical challenges such as non-stationarity, personalization, multi-objectives, and constraints. Unlike bespoke algorithms such as modified variants of Thomson sampling, our mathematical programming approach provides remarkably robust performance across instances.

arxiv情報

著者 Ethan Che,Daniel R. Jiang,Hongseok Namkoong,Jimmy Wang
発行日 2024-08-08 16:29:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク