Zero-Shot Constrained Motion Planning Transformers Using Learned Sampling Dictionaries

要約

制約されたロボットの動作計画は、日常環境と相互作用するロボットにとって普遍的なニーズですが、解決するのが非常に難しい問題として知られています。
サンプルベースのプランナー内の多くのサンプル点は、制約多様体から外れるか、修正するために多大な反復作業が必要となるため、拒否する必要があります。
これを考慮すると、妥当な時間内で低パスコストでロボットの制約を満たす軌道を提示するソリューションはほとんど存在しません。
この研究では、操作システムのタスク空間制約を伴う動作計画のためのトランスフォーマー ベースのモデルを紹介します。
Vector Quantized-Motion Planning Transformer (VQ-MPT) は、サンプリング ベースのモーション プランナーの制約なしプランニングの検索スペースを削減する、最近の学習ベースのモデルです。
モデルの再トレーニングや微調整を行わずに、事前トレーニング済みの VQ-MPT モデルを適応させて、制約計画の検索スペースを削減することを提案します。
また、ニューラル ネットワークの出力を更新して、サンプリング領域を制約多様体に近づけることも提案します。
私たちの実験では、シミュレーション環境と現実世界の環境において、VQ-MPT が従来のプランナーと比較して計画時間と精度をどのように向上させるかを示しています。
タスク関連のデータを必要とする以前の学習方法とは異なり、私たちの方法では事前トレーニングされたニューラル ネットワーク モデルを使用し、モデルのトレーニングと微調整のための追加データを必要とせず、\textit{ワンショット} プロセスになります。
また、実世界のセンサー データを使用して物理的な Franka Panda ロボットでメソッドをテストし、アルゴリズムの一般化可能性を実証しました。
私たちは、このアプローチがアクセスしやすく、学習したニューラル プランナーをさまざまなロボットと環境の相互作用シナリオに移行するのに広く役立つと期待しています。

要約(オリジナル)

Constrained robot motion planning is a ubiquitous need for robots interacting with everyday environments, but it is a notoriously difficult problem to solve. Many sampled points in a sample-based planner need to be rejected as they fall outside the constraint manifold, or require significant iterative effort to correct. Given this, few solutions exist that present a constraint-satisfying trajectory for robots, in reasonable time and of low path cost. In this work, we present a transformer-based model for motion planning with task space constraints for manipulation systems. Vector Quantized-Motion Planning Transformer (VQ-MPT) is a recent learning-based model that reduces the search space for unconstrained planning for sampling-based motion planners. We propose to adapt a pre-trained VQ-MPT model to reduce the search space for constraint planning without retraining or finetuning the model. We also propose to update the neural network output to move sampling regions closer to the constraint manifold. Our experiments show how VQ-MPT improves planning times and accuracy compared to traditional planners in simulated and real-world environments. Unlike previous learning methods, which require task-related data, our method uses pre-trained neural network models and requires no additional data for training and finetuning the model making this a \textit{one-shot} process. We also tested our method on a physical Franka Panda robot with real-world sensor data, demonstrating the generalizability of our algorithm. We anticipate this approach to be an accessible and broadly useful for transferring learned neural planners to various robotic-environment interaction scenarios.

arxiv情報

著者 Jacob J. Johnson,Ahmed H. Qureshi,Michael C. Yip
発行日 2023-09-26 21:13:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク