Reinforcement Learning with Frontier-Based Exploration via Autonomous Environment

要約

Active Simultaneous Localization and Mapping (SLAM) は自律ロボット工学における重要な問題であり、ロボットが周囲の正確なモデルを構築しながら新しい領域に移動できるようになります。
Visual SLAM は、仮想要素を使用してエクスペリエンスを向上させる人気のある技術です。
ただし、既存のフロンティアベースの探査戦略では、同様の距離のフロンティアが複数あるシナリオでは最適でないパスが発生する可能性があります。
この問題は、捜索救助、探索、地図作成などの幅広いロボット アプリケーションにとって重要な Visual SLAM の効率と精度に影響を与える可能性があります。
この問題に対処するために、この研究では、ExploreORB として知られる既存の Visual-Graph SLAM と強化学習の両方を組み合わせました。
提案されたアルゴリズムにより、ロボットは報酬ベースのシステムを通じて探索ルートを学習および最適化し、適切なフロンティアを選択して環境の正確な地図を作成できます。
フロンティアベースの探索は未踏の領域を検出するために使用され、強化学習は最適なフロンティア ポイントに報酬を割り当てることでロボットの動きを最適化します。
次に、Graph SLAM を使用してロボットの感覚データを統合し、環境の正確なマップを構築します。
提案されたアルゴリズムは、より正確な地図を構築するためにフロンティアの探索プロセスを最適化することにより、ExploreORB の効率と精度を向上させることを目的としています。
提案手法の有効性を評価するために、ロボットシミュレーションソフトウェアGazeboを使用してさまざまな仮想環境で実験を実施します。
これらの実験の結果は、自律ロボット工学における SLAM の最適なソリューションとして提案されたアプローチの可能性を実証するために既存の方法と比較されます。

要約(オリジナル)

Active Simultaneous Localisation and Mapping (SLAM) is a critical problem in autonomous robotics, enabling robots to navigate to new regions while building an accurate model of their surroundings. Visual SLAM is a popular technique that uses virtual elements to enhance the experience. However, existing frontier-based exploration strategies can lead to a non-optimal path in scenarios where there are multiple frontiers with similar distance. This issue can impact the efficiency and accuracy of Visual SLAM, which is crucial for a wide range of robotic applications, such as search and rescue, exploration, and mapping. To address this issue, this research combines both an existing Visual-Graph SLAM known as ExploreORB with reinforcement learning. The proposed algorithm allows the robot to learn and optimize exploration routes through a reward-based system to create an accurate map of the environment with proper frontier selection. Frontier-based exploration is used to detect unexplored areas, while reinforcement learning optimizes the robot’s movement by assigning rewards for optimal frontier points. Graph SLAM is then used to integrate the robot’s sensory data and build an accurate map of the environment. The proposed algorithm aims to improve the efficiency and accuracy of ExploreORB by optimizing the exploration process of frontiers to build a more accurate map. To evaluate the effectiveness of the proposed approach, experiments will be conducted in various virtual environments using Gazebo, a robot simulation software. Results of these experiments will be compared with existing methods to demonstrate the potential of the proposed approach as an optimal solution for SLAM in autonomous robotics.

arxiv情報

著者 Kenji Leong
発行日 2023-07-14 12:19:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク