Embodiment-Agnostic Navigation Policy Trained with Visual Demonstrations


我々は、ビジュアル デモンストレーションを活用して、実施形態に依存しないナビゲーション ポリシーをトレーニングする新しいフレームワークである、ビジュアル デモンストレーション ベースの実施形態に依存しないナビゲーション (ViDEN) フレームワークを提案します。
ViDEN は深度画像を利用して入力の次元を削減し、相対的なターゲット位置に依存するため、多様な環境への適応性が高まります。
タスク中心で実施形態に依存しないデモンストレーションで拡散ベースのポリシーをトレーニングすることにより、ViDEN は衝突のない適応軌道をリアルタイムで生成できます。
人間の到達と追跡に関する私たちの実験では、ViDEN が既存の方法を上回り、少量のデータを必要とし、屋内および屋外のさまざまなナビゲーション シナリオで優れたパフォーマンスを達成できることが実証されました。
プロジェクトの Web サイト: https://nimicurtis.github.io/ViDEN/。


Learning to navigate in unstructured environments is a challenging task for robots. While reinforcement learning can be effective, it often requires extensive data collection and can pose risk. Learning from expert demonstrations, on the other hand, offers a more efficient approach. However, many existing methods rely on specific robot embodiments, pre-specified target images and require large datasets. We propose the Visual Demonstration-based Embodiment-agnostic Navigation (ViDEN) framework, a novel framework that leverages visual demonstrations to train embodiment-agnostic navigation policies. ViDEN utilizes depth images to reduce input dimensionality and relies on relative target positions, making it more adaptable to diverse environments. By training a diffusion-based policy on task-centric and embodiment-agnostic demonstrations, ViDEN can generate collision-free and adaptive trajectories in real-time. Our experiments on human reaching and tracking demonstrate that ViDEN outperforms existing methods, requiring a small amount of data and achieving superior performance in various indoor and outdoor navigation scenarios. Project website: https://nimicurtis.github.io/ViDEN/.


著者 Nimrod Curtis,Osher Azulay,Avishai Sintov
発行日 2024-12-28 17:47:47+00:00
