ColorDynamic: Generalizable, Scalable, Real-time, End-to-end Local Planner for Unstructured and Dynamic Environments

要約

ディープ補強学習(DRL)は、ロボットのローカル計画の問題に対処する際の可能性を実証していますが、その有効性は非常に構造化されていない動的環境で拘束されたままです。
これらの課題に対処するために、この研究はColordynamicフレームワークを提案しています。
まず、エンドツーエンドのDRL定式化が確立され、生のセンサーデータを直接マップしてコマンドを制御し、それにより、構造化されていない環境との互換性を確保します。
この定式化の下で、新しいネットワークであるtransqerが導入されます。
Transqerは、時間的移行からのオンラインDRL学習を可能にし、動的シナリオでの意思決定を大幅に強化します。
多様なデータを使用したTransqerのスケーラブルなトレーニングを容易にするために、対称不変性を活用するデータ増強技術とともに、効率的なシミュレーションプラットフォームE-SPARROWが開発されます。
コロルディナミックの有効性を検証するために、一般化、スケーラビリティ、およびリアルタイムパフォーマンスの評価とともに、最先端の方法との比較評価が実施されました。
結果は、私たちのアプローチがリアルタイム容量(計画ごとに1.2〜1.3ミリ秒)を示す間、90%を超える成功率を達成することを示しています。
さらに、個々のコンポーネントの貢献を裏付けるために、アブレーション研究が実施されました。
これに基づいて、OkePlan-Colordynamic(OPCD)ナビゲーションシステムが提示されており、複雑なシナリオでの優位性と適用性を実証したシミュレーションおよび実際の実験が実証されています。
コードベースと実験的デモンストレーションは、再現性とさらなる研究を促進するために、当社のWebサイトにオープンソーリングされています。

要約(オリジナル)

Deep Reinforcement Learning (DRL) has demonstrated potential in addressing robotic local planning problems, yet its efficacy remains constrained in highly unstructured and dynamic environments. To address these challenges, this study proposes the ColorDynamic framework. First, an end-to-end DRL formulation is established, which maps raw sensor data directly to control commands, thereby ensuring compatibility with unstructured environments. Under this formulation, a novel network, Transqer, is introduced. The Transqer enables online DRL learning from temporal transitions, substantially enhancing decision-making in dynamic scenarios. To facilitate scalable training of Transqer with diverse data, an efficient simulation platform E-Sparrow, along with a data augmentation technique leveraging symmetric invariance, are developed. Comparative evaluations against state-of-the-art methods, alongside assessments of generalizability, scalability, and real-time performance, were conducted to validate the effectiveness of ColorDynamic. Results indicate that our approach achieves a success rate exceeding 90% while exhibiting real-time capacity (1.2-1.3 ms per planning). Additionally, ablation studies were performed to corroborate the contributions of individual components. Building on this, the OkayPlan-ColorDynamic (OPCD) navigation system is presented, with simulated and real-world experiments demonstrating its superiority and applicability in complex scenarios. The codebase and experimental demonstrations have been open-sourced on our website to facilitate reproducibility and further research.

arxiv情報

著者 Jinghao Xin,Zhichao Liang,Zihuan Zhang,Peng Wang,Ning Li
発行日 2025-02-27 09:01:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク