Roadmaps with Gaps over Controllers: Achieving Efficiency in Planning under Dynamics

要約

この論文は、学習済みコントローラーの使用を通じて、自明ではないダイナミクスを持つ移動ロボットの動作計画の計算効率を向上させることを目的としています。
これは分離戦略を採用しており、システム固有のコントローラーが最初に空の環境でオフラインでトレーニングされ、ロボットのダイナミクスに対処します。
ターゲット環境の場合、提案されたアプローチはオフラインでデータ構造である「ギャップのあるロードマップ」を構築し、学習されたコントローラーを使用してこの環境で計画クエリを解決する方法をおおよそ学習します。
ロードマップのノードはローカル領域に対応します。
エッジは、これらの領域を近似的に接続する学習された制御ポリシーのアプリケーションに対応します。
コントローラーがエッジに沿って個々の状態のペアを完全に接続しないため、ギャップが発生します。
オンラインでは、クエリが与えられると、ツリー サンプリング ベースのモーション プランナーがロードマップを使用して、ツリーの拡張が目標領域に向かって通知されるようにします。
ツリー展開では、目標に向かうロードマップ上の波面を考慮して、ローカルのサブ目標を選択します。
コントローラーがサブゴール領域に到達できない場合、プランナーは確率的な完全性と漸近的な最適性を維持するためにランダム探索に頼ります。
付随する実験評価では、このアプローチにより、不均一で摩擦が変化する地形における物理ベースの車両モデルや気圧の影響下でのクアローターなど、さまざまなベンチマークでの動作計画の計算効率が大幅に向上することが示されています。

要約(オリジナル)

This paper aims to improve the computational efficiency of motion planning for mobile robots with non-trivial dynamics through the use of learned controllers. It adopts a decoupled strategy, where a system-specific controller is first trained offline in an empty environment to deal with the robot’s dynamics. For a target environment, the proposed approach constructs offline a data structure, a ‘Roadmap with Gaps,’ to approximately learn how to solve planning queries in this environment using the learned controller. The nodes of the roadmap correspond to local regions. Edges correspond to applications of the learned control policy that approximately connect these regions. Gaps arise because the controller does not perfectly connect pairs of individual states along edges. Online, given a query, a tree sampling-based motion planner uses the roadmap so that the tree’s expansion is informed towards the goal region. The tree expansion selects local subgoals given a wavefront on the roadmap that guides towards the goal. When the controller cannot reach a subgoal region, the planner resorts to random exploration to maintain probabilistic completeness and asymptotic optimality. The accompanying experimental evaluation shows that the approach significantly improves the computational efficiency of motion planning on various benchmarks, including physics-based vehicular models on uneven and varying friction terrains as well as a quadrotor under air pressure effects.

arxiv情報

著者 Aravind Sivaramakrishnan,Sumanth Tangirala,Edgar Granados,Noah R. Carver,Kostas E. Bekris
発行日 2024-03-28 19:37:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク