Zonal RL-RRT: Integrated RL-RRT Path Planning with Collision Probability and Zone Connectivity

要約

高次元空間での経路計画は、特に時間効率と公正な成功率の両方を達成する上で、重大な課題を引き起こします。
これらの問題に対処するために、新しいパス プランニング アルゴリズムである Zonal RL-RRT を導入しました。これは、kd ツリー パーティショニングを利用してマップをゾーンにセグメント化し、同時にゾーン接続に対処し、ゾーン間のシームレスな移行を保証します。
複雑な環境を複数のゾーンに分割し、高レベルの意思決定者として Q ラーニングを使用することにより、私たちのアルゴリズムは、森林のようなマップでの RRT や RRT* などの基本的なサンプリング方法と比較して、時間効率の 3 倍の向上を達成します。
当社のアプローチは、BIT* や Informed RRT* などのヒューリスティック ガイド付き手法よりも実行時間の点で 1.5 倍優れており、2D から 6D 環境全体で堅牢で信頼性の高い成功率を維持します。
NeuralRRT* や MPNetSMP などの学習ベースの手法やヒューリスティック RRT*J と比較して、当社のアルゴリズムは同じ環境で平均して 1.5 倍のパフォーマンスを示します。
また、MuJoCo 環境での UR10e アーム マニピュレータのシミュレーションを通じて、アプローチの有効性を評価します。
私たちのアプローチの主な観察点は、ゾーン分割と強化学習 (RL) を適応的な高レベル計画に使用することで、アルゴリズムが多様な環境にわたる柔軟なポリシーに対応できるようになり、高度なパス計画のための多用途ツールとなることにあります。

要約(オリジナル)

Path planning in high-dimensional spaces poses significant challenges, particularly in achieving both time efficiency and a fair success rate. To address these issues, we introduce a novel path-planning algorithm, Zonal RL-RRT, that leverages kd-tree partitioning to segment the map into zones while addressing zone connectivity, ensuring seamless transitions between zones. By breaking down the complex environment into multiple zones and using Q-learning as the high-level decision-maker, our algorithm achieves a 3x improvement in time efficiency compared to basic sampling methods such as RRT and RRT* in forest-like maps. Our approach outperforms heuristic-guided methods like BIT* and Informed RRT* by 1.5x in terms of runtime while maintaining robust and reliable success rates across 2D to 6D environments. Compared to learning-based methods like NeuralRRT* and MPNetSMP, as well as the heuristic RRT*J, our algorithm demonstrates, on average, 1.5x better performance in the same environments. We also evaluate the effectiveness of our approach through simulations of the UR10e arm manipulator in the MuJoCo environment. A key observation of our approach lies in its use of zone partitioning and Reinforcement Learning (RL) for adaptive high-level planning allowing the algorithm to accommodate flexible policies across diverse environments, making it a versatile tool for advanced path planning.

arxiv情報

著者 AmirMohammad Tahmasbi,MohammadSaleh Faghfoorian,Saeed Khodaygan,Aniket Bera
発行日 2024-10-31 17:57:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク