要約
オプション ヘッジ/トレーディングの目的は、ダウンサイド リスクに対する単なる保護にとどまらず、利益を追求したいという欲求もエージェントの戦略を推進します。
この研究では、パス依存の金融デリバティブに関連するリスクを軽減するための堅牢なリスク認識強化学習 (RL) の可能性を紹介します。
これは、Jaimungal、Pesenti、Wang、Tatsat (2022) と、堅牢なリスク認識パフォーマンス基準を最適化する彼らの政策勾配アプローチを活用することによって達成されます。
この方法論をバリアオプションのヘッジに具体的に適用し、エージェントがリスク回避からリスク追求に移行するにつれて、最適なヘッジ戦略がどのように歪むかを強調します。
エージェントが戦略を強化する方法と同様に。
データ生成プロセス (DGP) がトレーニング DGP と異なる場合のヘッジのパフォーマンスをさらに調査し、堅牢な戦略が非堅牢なものよりも優れていることを示します。
要約(オリジナル)
The objectives of option hedging/trading extend beyond mere protection against downside risks, with a desire to seek gains also driving agent’s strategies. In this study, we showcase the potential of robust risk-aware reinforcement learning (RL) in mitigating the risks associated with path-dependent financial derivatives. We accomplish this by leveraging the Jaimungal, Pesenti, Wang, Tatsat (2022) and their policy gradient approach, which optimises robust risk-aware performance criteria. We specifically apply this methodology to the hedging of barrier options, and highlight how the optimal hedging strategy undergoes distortions as the agent moves from being risk-averse to risk-seeking. As well as how the agent robustifies their strategy. We further investigate the performance of the hedge when the data generating process (DGP) varies from the training DGP, and demonstrate that the robust strategies outperform the non-robust ones.
arxiv情報
著者 | David Wu,Sebastian Jaimungal |
発行日 | 2023-03-27 13:57:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google