Logarithmic-Regret Quantum Learning Algorithms for Zero-Sum Games

要約

我々は、ゲーム設定の下で$\widetilde O(1)$リ後悔を伴うゼロサムゲームを解くための最初のオンライン量子アルゴリズムを提案する。
さらに、私たちの量子アルゴリズムは、量子時間 $\widetilde O(\sqrt{m+n}/\varepsilon^{2.5} における $m \times n$ 行列ゼロサム ゲームの $\varepsilon$ 近似ナッシュ均衡を計算します。
)$。
私たちのアルゴリズムは標準的な量子入力を使用し、簡潔な記述を持つ古典的な出力を生成することで、エンドツーエンドのアプリケーションを容易にします。
技術的には、当社のオンライン量子アルゴリズムは、楽観的乗算重み更新法に基づいて古典的なアルゴリズムを「量子化」します。
私たちのアルゴリズムの中心となるのは、ギブス サンプリング問題に対する高速量子マルチサンプリング手順であり、これは独立して興味深いものになる可能性があります。

要約(オリジナル)

We propose the first online quantum algorithm for solving zero-sum games with $\widetilde O(1)$ regret under the game setting. Moreover, our quantum algorithm computes an $\varepsilon$-approximate Nash equilibrium of an $m \times n$ matrix zero-sum game in quantum time $\widetilde O(\sqrt{m+n}/\varepsilon^{2.5})$. Our algorithm uses standard quantum inputs and generates classical outputs with succinct descriptions, facilitating end-to-end applications. Technically, our online quantum algorithm ‘quantizes’ classical algorithms based on the optimistic multiplicative weight update method. At the heart of our algorithm is a fast quantum multi-sampling procedure for the Gibbs sampling problem, which may be of independent interest.

arxiv情報

著者 Minbo Gao,Zhengfeng Ji,Tongyang Li,Qisheng Wang
発行日 2024-09-30 15:59:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, quant-ph パーマリンク