Logarithmic-Regret Quantum Learning Algorithms for Zero-Sum Games

要約

タイトル:ゼロサムゲームのための対数的後悔量量子学習アルゴリズム

要約:

– ゼロサムゲームのためのオンライン量子アルゴリズムを提案している。
– このアルゴリズムは、ゲーム設定下で後悔量$\tilde O(1)$を持つ。
– また、この量子アルゴリズムは、$m \times n$行列のゼロサムゲームの$\varepsilon$-近似ナッシュ均衡を、$\tilde O(\sqrt{m+n}/\varepsilon^{2.5})$の量子時間で計算することができ、$m, n$に関して2次の改善をもたらす。
– このアルゴリズムは、標準的な量子入力を使用し、簡潔な説明を持つ古典的な出力を生成することができ、エンドトゥエンドアプリケーションを容易にする。
– このアルゴリズムを使用して、高速な量子線形計画ソルバーを得ることができる。
– 技術的には、楽観的な乗法重み更新法に基づく古典アルゴリズムを量子化することで、このオンライン量子アルゴリズムを実現している。
– このアルゴリズムの核心は、Gibbsサンプリング問題の高速量子マルチサンプリング手順であり、独立した研究の対象となる可能性がある。

要約(オリジナル)

We propose the first online quantum algorithm for zero-sum games with $\tilde O(1)$ regret under the game setting. Moreover, our quantum algorithm computes an $\varepsilon$-approximate Nash equilibrium of an $m \times n$ matrix zero-sum game in quantum time $\tilde O(\sqrt{m+n}/\varepsilon^{2.5})$, yielding a quadratic improvement over classical algorithms in terms of $m, n$. Our algorithm uses standard quantum inputs and generates classical outputs with succinct descriptions, facilitating end-to-end applications. As an application, we obtain a fast quantum linear programming solver. Technically, our online quantum algorithm ‘quantizes’ classical algorithms based on the optimistic multiplicative weight update method. At the heart of our algorithm is a fast quantum multi-sampling procedure for the Gibbs sampling problem, which may be of independent interest.

arxiv情報

著者 Minbo Gao,Zhengfeng Ji,Tongyang Li,Qisheng Wang
発行日 2023-04-27 14:02:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, math.OC, quant-ph パーマリンク