要約
オプションのヘッジ/取引の目的は、単なる下値リスクからの保護を超えて広がり、利益を追求したいという願望もエージェントの戦略を推進します。
この研究では、経路依存の金融デリバティブに関連するリスクを軽減するための堅牢なリスク認識強化学習 (RL) の可能性を紹介します。
当社は、リスクを意識した堅牢なパフォーマンス基準を最適化するポリシー勾配アプローチを活用することでこれを実現します。
私たちはこの方法論を特にバリアオプションのヘッジに適用し、エージェントがリスク回避型からリスク追求型に移行するにつれて最適なヘッジ戦略がどのように歪むかを強調します。
エージェントが戦略を強化する方法も同様です。
データ生成プロセス (DGP) がトレーニング DGP と異なる場合のヘッジのパフォーマンスをさらに調査し、ロバストな戦略が非ロバストな戦略よりも優れていることを示します。
要約(オリジナル)
The objectives of option hedging/trading extend beyond mere protection against downside risks, with a desire to seek gains also driving agent’s strategies. In this study, we showcase the potential of robust risk-aware reinforcement learning (RL) in mitigating the risks associated with path-dependent financial derivatives. We accomplish this by leveraging a policy gradient approach that optimises robust risk-aware performance criteria. We specifically apply this methodology to the hedging of barrier options, and highlight how the optimal hedging strategy undergoes distortions as the agent moves from being risk-averse to risk-seeking. As well as how the agent robustifies their strategy. We further investigate the performance of the hedge when the data generating process (DGP) varies from the training DGP, and demonstrate that the robust strategies outperform the non-robust ones.
arxiv情報
著者 | David Wu,Sebastian Jaimungal |
発行日 | 2023-12-26 18:31:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google