要約
量子機械学習 (QML) は、逐次制御タスクと時系列モデリングに対処する先駆的なフレームワークとして浮上しました。
特に強化学習 (RL) や時系列予測などの分野において、量子の経験的な利点が実証されています。
大幅な進歩は量子リカレント ニューラル ネットワーク (QRNN) にあり、特に部分的に観測可能な環境や非線形時系列予測を含むメモリ集約型タスク向けに調整されています。
それにもかかわらず、QRNN ベースのモデルは課題に直面しており、特に時間逆伝播 (BPTT) を使用して量子勾配を計算する必要性に起因するトレーニング期間の延長が顕著です。
この苦境は、量子デバイス上で完全なモデルを実行するときにさらに悪化します。これは、主にパラメータ シフト ルールから生じる回路評価に対する大きな需要が原因です。
このペーパーでは、時間的または逐次学習の課題に対する解決策として、Quantum Fast Weight Programmers (QFWP) を紹介します。
QFWP は、量子プログラマとして機能する古典的なニューラル ネットワーク (「低速プログラマ」と呼ばれる) を利用して、変分量子回路 (「高速プログラマ」と呼ばれる) のパラメータを迅速に変更します。
各タイムステップで高速プログラマを完全に上書きする代わりに、低速プログラマは量子回路パラメータのパラメータ変更または更新を生成します。
このアプローチにより、高速プログラマは過去の観察や情報を組み込むことができます。
特に、提案された QFWP モデルは、量子リカレント ニューラル ネットワークの使用を必要とせずに時間依存関係の学習を実現します。
この研究で実施された数値シミュレーションは、時系列予測と RL タスクの両方における提案された QFWP モデルの有効性を示しています。
このモデルは、QLSTM ベースのモデルで達成されるパフォーマンス レベルと同等またはそれを超えるパフォーマンス レベルを示します。
要約(オリジナル)
Quantum Machine Learning (QML) has surfaced as a pioneering framework addressing sequential control tasks and time-series modeling. It has demonstrated empirical quantum advantages notably within domains such as Reinforcement Learning (RL) and time-series prediction. A significant advancement lies in Quantum Recurrent Neural Networks (QRNNs), specifically tailored for memory-intensive tasks encompassing partially observable environments and non-linear time-series prediction. Nevertheless, QRNN-based models encounter challenges, notably prolonged training duration stemming from the necessity to compute quantum gradients using backpropagation-through-time (BPTT). This predicament exacerbates when executing the complete model on quantum devices, primarily due to the substantial demand for circuit evaluation arising from the parameter-shift rule. This paper introduces the Quantum Fast Weight Programmers (QFWP) as a solution to the temporal or sequential learning challenge. The QFWP leverages a classical neural network (referred to as the ‘slow programmer’) functioning as a quantum programmer to swiftly modify the parameters of a variational quantum circuit (termed the ‘fast programmer’). Instead of completely overwriting the fast programmer at each time-step, the slow programmer generates parameter changes or updates for the quantum circuit parameters. This approach enables the fast programmer to incorporate past observations or information. Notably, the proposed QFWP model achieves learning of temporal dependencies without necessitating the use of quantum recurrent neural networks. Numerical simulations conducted in this study showcase the efficacy of the proposed QFWP model in both time-series prediction and RL tasks. The model exhibits performance levels either comparable to or surpassing those achieved by QLSTM-based models.
arxiv情報
著者 | Samuel Yen-Chi Chen |
発行日 | 2024-02-27 18:53:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google