要約
不慣れな環境でのナビゲーションのためのロボット学習では、タスク指向のナビゲーション (つまり、ロボットが見つけた目標に到達する) とタスクに依存しない探索 (つまり、新しい環境での目標の検索) の両方のポリシーを提供する必要があります。
通常、これらの役割は、たとえばサブ目標の提案、計画、または個別のナビゲーション戦略を使用するなど、個別のモデルによって処理されます。
この論文では、目標指向のナビゲーションと目標に依存しない探索の両方を処理する単一の統合された拡散ポリシーをトレーニングする方法について説明します。後者は新しい環境を検索する機能を提供し、前者はユーザーに到達する機能を提供します。
目標が見つかったら、指定した目標を指定します。
この統一ポリシーにより、生成モデルからのサブ目標提案を使用するアプローチや、潜在変数モデルに基づく従来の方法と比較して、新しい環境で視覚的に示された目標にナビゲートするときに全体的なパフォーマンスが向上することを示します。
複数の地上ロボットからのデータでトレーニングされた大規模な Transformer ベースのポリシーと、目標条件付きナビゲーションと目標非依存型ナビゲーションの両方を柔軟に処理する拡散モデル デコーダーを使用してメソッドをインスタンス化します。
実世界のモバイルロボットプラットフォームで行われた私たちの実験は、5つの代替方法と比較して目に見えない環境で効果的なナビゲーションを示し、最先端のアプローチよりも小さなモデルを利用しているにもかかわらず、パフォーマンスの大幅な向上と衝突率の低下を実証しました。
。
その他のビデオ、コード、事前トレーニング済みモデルのチェックポイントについては、https://general-navigation-models.github.io/nomad/ を参照してください。
要約(オリジナル)
Robotic learning for navigation in unfamiliar environments needs to provide policies for both task-oriented navigation (i.e., reaching a goal that the robot has located), and task-agnostic exploration (i.e., searching for a goal in a novel setting). Typically, these roles are handled by separate models, for example by using subgoal proposals, planning, or separate navigation strategies. In this paper, we describe how we can train a single unified diffusion policy to handle both goal-directed navigation and goal-agnostic exploration, with the latter providing the ability to search novel environments, and the former providing the ability to reach a user-specified goal once it has been located. We show that this unified policy results in better overall performance when navigating to visually indicated goals in novel environments, as compared to approaches that use subgoal proposals from generative models, or prior methods based on latent variable models. We instantiate our method by using a large-scale Transformer-based policy trained on data from multiple ground robots, with a diffusion model decoder to flexibly handle both goal-conditioned and goal-agnostic navigation. Our experiments, conducted on a real-world mobile robot platform, show effective navigation in unseen environments in comparison with five alternative methods, and demonstrate significant improvements in performance and lower collision rates, despite utilizing smaller models than state-of-the-art approaches. For more videos, code, and pre-trained model checkpoints, see https://general-navigation-models.github.io/nomad/
arxiv情報
著者 | Ajay Sridhar,Dhruv Shah,Catherine Glossop,Sergey Levine |
発行日 | 2023-10-11 21:07:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google