Online Resource Allocation with Convex-set Machine-Learned Advice

要約

意思決定者は多くの場合、アドバイスと呼ばれる機械学習による需要予測にアクセスでき、リソース割り当てのためのオンライン意思決定プロセスで利用できる可能性があります。
ただし、そのようなアドバイスを活用すると、不正確になる可能性があるため課題が生じます。
この問題に対処するために、信頼性が低い可能性がある機械学習 (ML) アドバイスを使用して、オンラインでのリソース割り当ての決定を強化するフレームワークを提案します。
ここでは、このアドバイスが需要ベクトルに対して設定された一般的な凸の不確実性によって表されると仮定します。
一貫した比率と堅牢な比率の間でバランスをとる、パレート最適オンライン リソース割り当てアルゴリズムのパラメーター化されたクラスを導入します。
一貫した比率は、ML アドバイスが正確な場合のアルゴリズムのパフォーマンス (後知恵の最適なソリューションと比較した) を測定し、一方、ロバストな比率は、アドバイスが不正確な場合の敵対的な要求プロセスの下でのパフォーマンスを取得します。
具体的には、C-パレート最適設定では、一貫した比率が少なくとも C であることを保証しながら、ロバスト比率を最大化します。私たちが提案する C-パレート最適アルゴリズムは、適応型保護レベル アルゴリズムであり、で導入された古典的な固定保護レベル アルゴリズムを拡張します。
リトルウッド (2005) およびボールとケランヌ (2009)。
複雑な非凸連続最適化問題を解くことが、適応保護レベル アルゴリズムの特徴となります。
私たちのアルゴリズムを補完するために、ML アドバイスの最大値の推定値として機能する、達成可能な最大の一貫した比率を計算する簡単な方法を紹介します。
さらに、ベンチマーク アルゴリズムと比較してアルゴリズムのパフォーマンスを評価するための数値研究を紹介します。
この結果は、パラメーター C を調整することで、アルゴリズムが最悪の場合のパフォーマンスと平均的なパフォーマンスのバランスを効果的に取り、ベンチマーク アルゴリズムを上回るパフォーマンスを示していることを示しています。

要約(オリジナル)

Decision-makers often have access to a machine-learned prediction about demand, referred to as advice, which can potentially be utilized in online decision-making processes for resource allocation. However, exploiting such advice poses challenges due to its potential inaccuracy. To address this issue, we propose a framework that enhances online resource allocation decisions with potentially unreliable machine-learned (ML) advice. We assume here that this advice is represented by a general convex uncertainty set for the demand vector. We introduce a parameterized class of Pareto optimal online resource allocation algorithms that strike a balance between consistent and robust ratios. The consistent ratio measures the algorithm’s performance (compared to the optimal hindsight solution) when the ML advice is accurate, while the robust ratio captures performance under an adversarial demand process when the advice is inaccurate. Specifically, in a C-Pareto optimal setting, we maximize the robust ratio while ensuring that the consistent ratio is at least C. Our proposed C-Pareto optimal algorithm is an adaptive protection level algorithm, which extends the classical fixed protection level algorithm introduced in Littlewood (2005) and Ball and Queyranne (2009). Solving a complex non-convex continuous optimization problem characterizes the adaptive protection level algorithm. To complement our algorithms, we present a simple method for computing the maximum achievable consistent ratio, which serves as an estimate for the maximum value of the ML advice. Additionally, we present numerical studies to evaluate the performance of our algorithm in comparison to benchmark algorithms. The results demonstrate that by adjusting the parameter C, our algorithms effectively strike a balance between worst-case and average performance, outperforming the benchmark algorithms.

arxiv情報

著者 Negin Golrezaei,Patrick Jaillet,Zijie Zhou
発行日 2023-06-21 14:09:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, math.OC パーマリンク