要約
未知の純粋なqubit状態の$ n $コピーへのシーケンシャルアクセスを使用して、可能な最大エネルギーをバッテリーに伝達するように設計された作業抽出プロトコルを調査します。
コアの課題は、2つの競合する目標のバランスを最適にバランスさせるための相互作用を設計することです。バッテリーの手元に最適に充電し、その後のラウンドでのエネルギー収穫を改善するためにQubitによってより多くの情報を取得することです。
ここでは、強化学習における探査と爆発のトレードオフを活用して、$ n $でポリロガリズム的にのみスケーリングするエネルギー散逸を達成する適応戦略を開発します。
これは、完全な状態断層撮影に基づく現在のプロトコルに対する指数関数的な改善を表しています。
要約(オリジナル)
We investigate work extraction protocols designed to transfer the maximum possible energy to a battery using sequential access to $N$ copies of an unknown pure qubit state. The core challenge is designing interactions to optimally balance two competing goals: charging of the battery optimally using the qubit in hand, and acquiring more information by qubit to improve energy harvesting in subsequent rounds. Here, we leverage exploration-exploitation trade-off in reinforcement learning to develop adaptive strategies achieving energy dissipation that scales only poly-logarithmically in $N$. This represents an exponential improvement over current protocols based on full state tomography.
arxiv情報
著者 | Josep Lumbreras,Ruo Cheng Huang,Yanglin Hu,Mile Gu,Marco Tomamichel |
発行日 | 2025-05-14 15:07:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google