LDP: A Local Diffusion Planner for Efficient Robot Navigation and Collision Avoidance

要約

条件付き拡散モデルは、ポリシーの条件付き分布を正確にモデル化するための進歩により、ロボット ポリシーを学習するための効率的なツールとして実証されています。
動的障害物や迷路のような構造によって特徴づけられる現実世界のシナリオの複雑な性質は、条件付き分布問題としてのロボットのローカル ナビゲーションの意思決定の複雑さを強調しています。
それにもかかわらず、ロボットのローカル ナビゲーションに普及モデルを活用することは簡単ではなく、未調査のいくつかの課題に直面します。(1) データの緊急性。
ローカル ナビゲーションにおける複雑な条件付き配信には、現実世界の多様なシナリオにおける多様なポリシーを含めるためのトレーニング データが必要です。
(2) 近視観察。
認識シナリオが多様であるため、ロボットには先見性が欠けていることが多いため、ロボットのローカルな視点に基づいた拡散の決定は、タスク全体を完了する上で最適ではないことが判明する可能性があります。
迂回が必要な特定のシナリオでは、ロボットが閉じ込められる可能性があります。
これらの問題に対処するために、私たちのアプローチは、グローバルとローカルの統合された洞察に基づいたターゲット選択を通じて、異なる選好を示す複数のエージェントを包含する多様なデータ生成メカニズムの探索から始まります。
次に、この多様なトレーニング データに基づいて、さまざまなシナリオで優れた衝突回避が可能な拡散エージェントが取得されます。
その後、地球規模の観測を軽量な方法で組み込むことにより、ローカル拡散プランナー (LDP としても知られる) を強化します。
この機能強化により、LDP の観測範囲が広がり、局所最適化に陥るリスクが効果的に軽減され、より堅牢なナビゲーション決定が促進されます。

要約(オリジナル)

The conditional diffusion model has been demonstrated as an efficient tool for learning robot policies, owing to its advancement to accurately model the conditional distribution of policies. The intricate nature of real-world scenarios, characterized by dynamic obstacles and maze-like structures, underscores the complexity of robot local navigation decision-making as a conditional distribution problem. Nevertheless, leveraging the diffusion model for robot local navigation is not trivial and encounters several under-explored challenges: (1) Data Urgency. The complex conditional distribution in local navigation needs training data to include diverse policy in diverse real-world scenarios; (2) Myopic Observation. Due to the diversity of the perception scenarios, diffusion decisions based on the local perspective of robots may prove suboptimal for completing the entire task, as they often lack foresight. In certain scenarios requiring detours, the robot may become trapped. To address these issues, our approach begins with an exploration of a diverse data generation mechanism that encompasses multiple agents exhibiting distinct preferences through target selection informed by integrated global-local insights. Then, based on this diverse training data, a diffusion agent is obtained, capable of excellent collision avoidance in diverse scenarios. Subsequently, we augment our Local Diffusion Planner, also known as LDP by incorporating global observations in a lightweight manner. This enhancement broadens the observational scope of LDP, effectively mitigating the risk of becoming ensnared in local optima and promoting more robust navigational decisions.

arxiv情報

著者 Wenhao Yu,Jie Peng,Huanyu Yang,Junrui Zhang,Yifan Duan,Jianmin Ji,Yanyong Zhang
発行日 2024-07-02 04:53:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク