Generalizable Motion Planning via Operator Learning

要約

この研究では、動作計画問題の値関数を予測するための計画ニューラル オペレーター (PNO) を導入します。
値関数の近似を、コスト関数空間から値関数空間への単一の演算子を学習するものとして再構成します。値関数空間は、Eikonal 偏微分方程式 (PDE) によって定義されます。
具体的には、値関数の計算を連続関数空間全体にわたる単一の演算子を学習するものとして再構成し、これが Eikonal PDE を解くことと同等であることを証明します。
この再定式化を通じて、学習した PNO は再トレーニングすることなく新しい動作計画の問題に一般化することができます。
したがって、私たちの PNO モデルは、粗い解像度で有限数のサンプルを使用してトレーニングされているにもかかわらず、ニューラル オペレーターのゼロショット超解像度特性を継承しています。
MovingAI ラボの 2D 都市データセットでトレーニング解像度の 16 倍での正確な値関数近似を実証し、iGibson 建物データセットの 3D シーンで最先端のニューラル値関数予測子と比較します。
最後に、動作計画を加速するためのヒューリスティック関数として PNO の価値関数出力を使用することを調査します。
値関数が三角不等式を満たすことを保証する誘導バイアス層を導入することにより、PNO ヒューリスティックが $\epsilon$ 一貫性があることを理論的に示します。
私たちのヒューリスティックを使用すると、従来の計画手法 (A*、RRT*) と比較して、MovingAI ラボの 2D 都市データセット上で最適に近い経路長を取得しながら、訪問するノードの 30% 減少を達成できます。

要約(オリジナル)

In this work, we introduce a planning neural operator (PNO) for predicting the value function of a motion planning problem. We recast value function approximation as learning a single operator from the cost function space to the value function space, which is defined by an Eikonal partial differential equation (PDE). Specifically, we recast computing value functions as learning a single operator across continuous function spaces which prove is equivalent to solving an Eikonal PDE. Through this reformulation, our learned PNO is able to generalize to new motion planning problems without retraining. Therefore, our PNO model, despite being trained with a finite number of samples at coarse resolution, inherits the zero-shot super-resolution property of neural operators. We demonstrate accurate value function approximation at 16 times the training resolution on the MovingAI lab’s 2D city dataset and compare with state-of-the-art neural value function predictors on 3D scenes from the iGibson building dataset. Lastly, we investigate employing the value function output of PNO as a heuristic function to accelerate motion planning. We show theoretically that the PNO heuristic is $\epsilon$-consistent by introducing an inductive bias layer that guarantees our value functions satisfy the triangle inequality. With our heuristic, we achieve a 30% decrease in nodes visited while obtaining near optimal path lengths on the MovingAI lab 2D city dataset, compared to classical planning methods (A*, RRT*).

arxiv情報

著者 Sharath Matada,Luke Bhan,Yuanyuan Shi,Nikolay Atanasov
発行日 2024-10-23 04:06:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク