Research on Robot Path Planning Based on Reinforcement Learning

要約

本プロジェクトでは、Visual SLAMに基づくロボットの経路計画に関する研究を行ってきました。
このプロジェクトの主な作業は次のとおりです。 (1) Visual SLAM システムの構築。
Visual SLAM の基本アーキテクチャに関する研究が行われています。
Visual SLAMシステムはORB-SLAM3システムをベースに開発されており、高密度点群マッピングが可能です。
(2)地図変換により2次元経路計画に適した地図が得られる。
この部分は、Visual SLAM システムによって取得された密な点群マップをオクトマップに変換し、グリッド マップに射影変換を実行します。
マップ変換では、大量の冗長なマップ情報を含む高密度点群マップを、経路計画に適した非常に軽量なグリッド マップに変換します。
(3) 強化学習に基づく経路計画アルゴリズムの研究。
このプロジェクトは、Q 学習アルゴリズム、DQN アルゴリズム、および SARSA アルゴリズムの間で実験的な比較を実施し、DQN が高次元の複雑な環境において最も高速な収束と最高のパフォーマンスを備えたアルゴリズムであることを発見しました。
このプロジェクトでは、シミュレーション環境で Visual SLAM システムの実験検証を実施しました。
オープンソースのデータセットと自作のデータセットに基づいて得られた実験結果は、設計された Visual SLAM システムの実現可能性と有効性を証明しています。
同時に、このプロジェクトでは、同じ実験条件下で 3 つの強化学習アルゴリズムの比較実験も行い、実験条件下で最適なアルゴリズムを求めました。

要約(オリジナル)

This project has conducted research on robot path planning based on Visual SLAM. The main work of this project is as follows: (1) Construction of Visual SLAM system. Research has been conducted on the basic architecture of Visual SLAM. A Visual SLAM system is developed based on ORB-SLAM3 system, which can conduct dense point cloud mapping. (2) The map suitable for two-dimensional path planning is obtained through map conversion. This part converts the dense point cloud map obtained by Visual SLAM system into an octomap and then performs projection transformation to the grid map. The map conversion converts the dense point cloud map containing a large amount of redundant map information into an extremely lightweight grid map suitable for path planning. (3) Research on path planning algorithm based on reinforcement learning. This project has conducted experimental comparisons between the Q-learning algorithm, the DQN algorithm, and the SARSA algorithm, and found that DQN is the algorithm with the fastest convergence and best performance in high-dimensional complex environments. This project has conducted experimental verification of the Visual SLAM system in a simulation environment. The experimental results obtained based on open-source dataset and self-made dataset prove the feasibility and effectiveness of the designed Visual SLAM system. At the same time, this project has also conducted comparative experiments on the three reinforcement learning algorithms under the same experimental condition to obtain the optimal algorithm under the experimental condition.

arxiv情報

著者 Wang Ruiqi
発行日 2024-04-22 10:49:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク