Learning to navigate efficiently and precisely in real environments

要約

地上ロボットの自律航行の文脈では、エージェントのダイナミクスとセンシングのための現実的なモデルの作成は、ロボット工学の文献や商用アプリケーションで広く普及しており、モデルベースの制御や位置特定とマッピングに使用されています。
一方、より最近の Embodied AI の文献は、Habitat や AI-Thor などのシミュレーターで訓練されたモジュール式またはエンドツーエンドのエージェントに焦点を当てており、写真のようにリアルなレンダリングとシーンの多様性に重点が置かれていますが、忠実度は高くありません。
ロボットの動作には、それほど特権のない役割が割り当てられます。
結果として生じる sim2real ギャップは、トレーニング済みモデルの実際のロボット プラットフォームへの転送に大きな影響を与えます。
この研究では、センシングと作動の両方において sim2real ギャップを最小限に抑える設定でのシミュレーションにおけるエージェントのエンドツーエンドのトレーニングを調査します。
私たちのエージェントは、(離散化された) 速度コマンドを直接予測します。このコマンドは、実際のロボットの閉ループ制御を通じて維持されます。
実際のロボット (基礎となる低レベル コントローラーを含む) の動作が特定され、修正された Habitat シミュレーターでシミュレートされます。
オドメトリとローカリゼーションのノイズ モデルは、sim2real ギャップの削減にさらに貢献します。
実際のナビゲーション シナリオを評価し、さまざまなローカリゼーションとポイント目標の計算方法を調査し、以前の研究と比較してパフォーマンスと堅牢性が大幅に向上したことを報告します。

要約(オリジナル)

In the context of autonomous navigation of terrestrial robots, the creation of realistic models for agent dynamics and sensing is a widespread habit in the robotics literature and in commercial applications, where they are used for model based control and/or for localization and mapping. The more recent Embodied AI literature, on the other hand, focuses on modular or end-to-end agents trained in simulators like Habitat or AI-Thor, where the emphasis is put on photo-realistic rendering and scene diversity, but high-fidelity robot motion is assigned a less privileged role. The resulting sim2real gap significantly impacts transfer of the trained models to real robotic platforms. In this work we explore end-to-end training of agents in simulation in settings which minimize the sim2real gap both, in sensing and in actuation. Our agent directly predicts (discretized) velocity commands, which are maintained through closed-loop control in the real robot. The behavior of the real robot (including the underlying low-level controller) is identified and simulated in a modified Habitat simulator. Noise models for odometry and localization further contribute in lowering the sim2real gap. We evaluate on real navigation scenarios, explore different localization and point goal calculation methods and report significant gains in performance and robustness compared to prior work.

arxiv情報

著者 Guillaume Bono,Hervé Poirier,Leonid Antsfeld,Gianluca Monaci,Boris Chidlovskii,Christian Wolf
発行日 2024-01-25 17:50:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク