Roadmaps with Gaps over Controllers: Achieving Efficiency in Planning under Dynamics

要約

この論文は、学習されたコントローラーを利用することで、自明ではないダイナミクスを持つ移動ロボットの動作計画の計算効率を向上させることを目的としています。
これは分離戦略を採用しており、システム固有のコントローラーが最初に空の環境でオフラインでトレーニングされ、システムのダイナミクスに対処します。
環境に対して、提案されたアプローチは、学習されたコントローラーを使用してこの環境で計画クエリを解決する方法をおおよそ学習するために、データ構造である「ギャップのあるロードマップ」をオフラインで構築します。
そのノードはローカル領域に対応し、エッジはこれらの領域を近似的に接続する学習された制御ポリシーのアプリケーションに対応します。
ギャップは、コントローラーがエッジに沿って個々の状態のペアを完全に接続していないために発生します。
オンラインでは、クエリが与えられると、ツリー サンプリング ベースのモーション プランナーがロードマップを使用して、ツリーの拡張が目標領域に向かって通知されるようにします。
ツリー展開では、目標に向かうロードマップ上の波面を考慮して、ローカルのサブ目標を選択します。
コントローラーがサブゴール領域に到達できない場合、プランナーは確率的な完全性と漸近的な最適性を維持するためにランダム探索に頼ります。
実験による評価では、このアプローチにより、不均一で摩擦が変化する地形における物理ベースの車両モデルや気圧の影響下でのクワッドローターなど、さまざまなベンチマークでの動作計画の計算効率が大幅に向上することが示されています。

要約(オリジナル)

This paper aims to improve the computational efficiency of motion planning for mobile robots with non-trivial dynamics by taking advantage of learned controllers. It adopts a decoupled strategy, where a system-specific controller is first trained offline in an empty environment to deal with the system’s dynamics. For an environment, the proposed approach constructs offline a data structure, a ‘Roadmap with Gaps,’ to approximately learn how to solve planning queries in this environment using the learned controller. Its nodes correspond to local regions and edges correspond to applications of the learned control policy that approximately connect these regions. Gaps arise due to the controller not perfectly connecting pairs of individual states along edges. Online, given a query, a tree sampling-based motion planner uses the roadmap so that the tree’s expansion is informed towards the goal region. The tree expansion selects local subgoals given a wavefront on the roadmap that guides towards the goal. When the controller cannot reach a subgoal region, the planner resorts to random exploration to maintain probabilistic completeness and asymptotic optimality. The experimental evaluation shows that the approach significantly improves the computational efficiency of motion planning on various benchmarks, including physics-based vehicular models on uneven and varying friction terrains as well as a quadrotor under air pressure effects.

arxiv情報

著者 Aravind Sivaramakrishnan,Noah R. Carver,Sumanth Tangirala,Kostas E. Bekris
発行日 2023-10-05 01:21:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク