要約
自律駐車場は、自動運転の研究開発において重要なアプリケーションとなっています。
多くの場合、駐車場では、限られたスペースと複雑な環境に悩まされており、正確な知覚と正確な操作が必要です。
従来のルールベースの駐車アルゴリズムは、多様で予測不可能な条件に適応するのに苦労していますが、学習ベースのアルゴリズムには、さまざまなシナリオで一貫した安定したパフォーマンスがありません。
したがって、ルールベースの方法の安定性と学習ベースの方法の一般化可能性を組み合わせたハイブリッドアプローチが必要です。
最近、強化学習(RL)ベースのポリシーは、タスクの計画において堅牢な能力を示しています。
ただし、シミュレーションから現実(SIMからリアル)の転送ギャップは、実際の展開を深刻にブロックします。
これらの問題に対処するために、ルールベースのReeds-Shepp(RS)プランナーと学習ベースの強化学習(RL)プランナーで構成されるハイブリッドポリシーを採用しています。
リアルタイムのLIDARベースの占有グリッドマップ(OGM)表現が採用され、SIMからリアルのギャップを埋めるためにハイブリッドポリシーをリードすることは、現実世界のシステムにシームレスに適用できます。
シミュレーション環境と実世界のシナリオの両方で広範な実験を実施しましたが、その結果、提案された方法が純粋なルールベースと学習ベースの方法よりも優れていることを示しています。
現実世界の実験は、提案された方法の実現可能性と効率をさらに検証します。
要約(オリジナル)
Autonomous parking has become a critical application in automatic driving research and development. Parking operations often suffer from limited space and complex environments, requiring accurate perception and precise maneuvering. Traditional rule-based parking algorithms struggle to adapt to diverse and unpredictable conditions, while learning-based algorithms lack consistent and stable performance in various scenarios. Therefore, a hybrid approach is necessary that combines the stability of rule-based methods and the generalizability of learning-based methods. Recently, reinforcement learning (RL) based policy has shown robust capability in planning tasks. However, the simulation-to-reality (sim-to-real) transfer gap seriously blocks the real-world deployment. To address these problems, we employ a hybrid policy, consisting of a rule-based Reeds-Shepp (RS) planner and a learning-based reinforcement learning (RL) planner. A real-time LiDAR-based Occupancy Grid Map (OGM) representation is adopted to bridge the sim-to-real gap, leading the hybrid policy can be applied to real-world systems seamlessly. We conducted extensive experiments both in the simulation environment and real-world scenarios, and the result demonstrates that the proposed method outperforms pure rule-based and learning-based methods. The real-world experiment further validates the feasibility and efficiency of the proposed method.
arxiv情報
著者 | Zhitao Wang,Zhe Chen,Mingyang Jiang,Tong Qin,Ming Yang |
発行日 | 2025-02-26 05:32:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google