Dynamic Pricing in High-Speed Railways Using Multi-Agent Reinforcement Learning

要約

この文書では、高速旅客鉄道業界における重要な課題、つまり、競合および協力する事業者を背景とした効果的なダイナミックプライシング戦略の設計について取り上げます。
これに対処するために、非ゼロサム マルコフ ゲームに基づくマルチエージェント強化学習 (MARL) フレームワークが提案され、乗客の意思決定を捉えるためのランダム ユーティリティ モデルが組み込まれています。
エネルギー、航空会社、モバイルネットワークなどの分野における先行研究とは異なり、深層強化学習を使用した鉄道システムの動的価格設定はあまり注目されていません。
この論文の主な貢献は、RailPricing-RL と呼ばれる、ユーザー行動の現実的で微細なモデリングを可能にしながら、さまざまな鉄道ネットワーク構成と需要パターンをモデル化するように設計された、パラメーター化可能で多用途な強化学習シミュレーターです。
この環境は、提案された MARL フレームワークをサポートします。このフレームワークは、接続サービスを同期するための協力的な行動を促進しながら、個々の利益を最大化するために競合する異種エージェントをモデル化します。
実験結果はフレームワークを検証し、ユーザーの好みが MARL のパフォーマンスにどのように影響するか、また価格設定ポリシーが乗客の選択、ユーティリティ、およびシステム全体のダイナミクスにどのように影響するかを示しています。
この研究は、鉄道システムにおける動的価格戦略を推進し、収益性をシステム全体の効率と調整し、価格政策の最適化に関する将来の研究を支援するための基盤を提供します。

要約(オリジナル)

This paper addresses a critical challenge in the high-speed passenger railway industry: designing effective dynamic pricing strategies in the context of competing and cooperating operators. To address this, a multi-agent reinforcement learning (MARL) framework based on a non-zero-sum Markov game is proposed, incorporating random utility models to capture passenger decision making. Unlike prior studies in areas such as energy, airlines, and mobile networks, dynamic pricing for railway systems using deep reinforcement learning has received limited attention. A key contribution of this paper is a parametrisable and versatile reinforcement learning simulator designed to model a variety of railway network configurations and demand patterns while enabling realistic, microscopic modelling of user behaviour, called RailPricing-RL. This environment supports the proposed MARL framework, which models heterogeneous agents competing to maximise individual profits while fostering cooperative behaviour to synchronise connecting services. Experimental results validate the framework, demonstrating how user preferences affect MARL performance and how pricing policies influence passenger choices, utility, and overall system dynamics. This study provides a foundation for advancing dynamic pricing strategies in railway systems, aligning profitability with system-wide efficiency, and supporting future research on optimising pricing policies.

arxiv情報

著者 Enrique Adrian Villarrubia-Martin,Luis Rodriguez-Benitez,David Muñoz-Valero,Giovanni Montana,Luis Jimenez-Linares
発行日 2025-01-14 16:19:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.MA パーマリンク