JAX-LOB: A GPU-Accelerated limit order book simulator to unlock large scale reinforcement learning for trading

要約

世界中の金融取引所は、指値注文帳 (LOB) を使用して注文を処理し、取引を照合します。
研究目的では、LOB ダイナミクスの大規模で効率的なシミュレーターを用意することが重要です。
LOB シミュレーターはこれまで、エージェント ベース モデル (ABM)、強化学習 (RL) 環境、生成モデルのコンテキストで実装され、履歴データ セットと手作りのエージェントからのオーダー フローを同様に処理していました。
多くのアプリケーションでは、ABM の調整または RL エージェントのトレーニングのために、複数の書籍を処理する必要があります。
メッセージごとの処理時間を大幅に短縮して、数千冊の書籍を並行して処理するように設計された、初の GPU 対応 LOB シミュレーターを紹介します。
私たちのシミュレータ – JAX-LOB – の実装は、LOB 関連のメカニズムの現実性を損なうことなく、JAX の機能を最大限に活用することを目的とした設計上の選択に基づいています。
JAX-LOB を他の JAX パッケージと統合して、強化学習を使用して最適な実行問題に対処する方法の例を提供し、GPU でのエンドツーエンド RL トレーニングの予備結果を共有します。

要約(オリジナル)

Financial exchanges across the world use limit order books (LOBs) to process orders and match trades. For research purposes it is important to have large scale efficient simulators of LOB dynamics. LOB simulators have previously been implemented in the context of agent-based models (ABMs), reinforcement learning (RL) environments, and generative models, processing order flows from historical data sets and hand-crafted agents alike. For many applications, there is a requirement for processing multiple books, either for the calibration of ABMs or for the training of RL agents. We showcase the first GPU-enabled LOB simulator designed to process thousands of books in parallel, with a notably reduced per-message processing time. The implementation of our simulator – JAX-LOB – is based on design choices that aim to best exploit the powers of JAX without compromising on the realism of LOB-related mechanisms. We integrate JAX-LOB with other JAX packages, to provide an example of how one may address an optimal execution problem with reinforcement learning, and to share some preliminary results from end-to-end RL training on GPUs.

arxiv情報

著者 Sascha Frey,Kang Li,Peer Nagy,Silvia Sapora,Chris Lu,Stefan Zohren,Jakob Foerster,Anisoara Calinescu
発行日 2023-08-25 10:26:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CE, cs.LG, q-fin.TR パーマリンク