Anticipatory Fleet Repositioning for Shared-use Autonomous Mobility Services: An Optimization and Learning-Based Approach

要約

タイトル:共有利用自動運行サービスに向けた先回り型フリート再配置:最適化と学習ベースの手法

要約:移動需要サービス、豊富な交通データ、自動運転車(AV)の開発により、共有利用AV移動サービス(SAMS)が提供するアクセス可能で需要に応じた個人モビリティの重要な機会が生まれました。SAMSフリートの運転は、高いサービス品質で乗客のリクエストを効率的に達成することに主眼を置いた、複数の相互関連する決定を含みます。この論文は、アイドル状態の車両の先回り型再配置により、SAMS車両フリートの効率性とサービス品質を向上させることに焦点を当てています。リバランス問題はマルコフ決定プロセスとして定式化され、アドバンテージアクタークリティック(A2C)強化学習ベースの手法を用いて解決することを提案しています。提案された手法は、将来の需要を予測し最適化ベースの割り当て戦略に協力するリバランスポリシーを学習し、集中的な再配置決定を可能にし、車両フリートが大きくても問題の大きさがフリートサイズに変化しないという特徴があります。ニューヨーク市のタクシーデータとエージェントベースのシミュレーションツールを使用して、A2C AV再配置アプローチの2つのバージョンがテストされました。最初のバージョンであるA2C-AVR(A)では、過去の観測に基づいて将来の需要を予測できるようになり、2番目のバージョンであるA2C-AVR(B)は需要予測を使用します。これらのモデルは最適化ベースのリバランスアプローチと比較され、平均乗客待ち時間の大幅な短縮が示され、わずかに空のフリートマイル走行率が増加しています。これらの実験は、モデルが将来の需要を予測し、トレーニング段階で見たことのないケースに対しても転送可能であることを示しています。

– SAMS(共有利用AV移動サービス)フリートの再配置は、リバランシング問題として定式化され、効率的に対処するためにA2C強化学習ベースの手法を提案している。
– 提案手法は、将来の需要を予測するためのA2C-AVR(A)と需要予測を使用するA2C-AVR(B)の2つのバージョンがある。
– 実験の結果、提案手法は平均乗客待ち時間を短縮できることが示されている。
– モデルは将来の需要を予測できることが示され、トレーニング段階で見たことのないケースに対しても転送可能であることが示されている。

要約(オリジナル)

The development of mobility-on-demand services, rich transportation data sources, and autonomous vehicles (AVs) creates significant opportunities for shared-use AV mobility services (SAMSs) to provide accessible and demand-responsive personal mobility. SAMS fleet operation involves multiple interrelated decisions, with a primary focus on efficiently fulfilling passenger ride requests with a high level of service quality. This paper focuses on improving the efficiency and service quality of a SAMS vehicle fleet via anticipatory repositioning of idle vehicles. The rebalancing problem is formulated as a Markov Decision Process, which we propose solving using an advantage actor critic (A2C) reinforcement learning-based method. The proposed approach learns a rebalancing policy that anticipates future demand and cooperates with an optimization-based assignment strategy. The approach allows for centralized repositioning decisions and can handle large vehicle fleets since the problem size does not change with the fleet size. Using New York City taxi data and an agent-based simulation tool, two versions of the A2C AV repositioning approach are tested. The first version, A2C-AVR(A), learns to anticipate future demand based on past observations, while the second, A2C-AVR(B), uses demand forecasts. The models are compared to an optimization-based rebalancing approach and show significant reduction in mean passenger waiting times, with a slightly increased percentage of empty fleet miles travelled. The experiments demonstrate the model’s ability to anticipate future demand and its transferability to cases unseen at the training stage.

arxiv情報

著者 Monika Filipovska,Michael Hyland,Haimanti Bala
発行日 2023-04-12 20:23:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CY, cs.SY, eess.SY パーマリンク