要約
私たちは、廊下や家具などの環境上の制約がある密集したインタラクティブな群衆におけるロボットのナビゲーションの問題を研究します。
これまでの方法では、エージェントと障害物間のあらゆる種類の相互作用が考慮されておらず、ロボットの経路が安全でなく非効率なものになってしまいました。
この記事では、混雑した制約されたシナリオのグラフベースの表現を活用し、深層強化学習でロボットのナビゲーション ポリシーを学習するための構造化フレームワークを提案します。
まず、環境内のさまざまなコンポーネントの表現を分割し、人間、ロボット、障害物間の異なる相互作用をモデル化するための異種時空間 (st) グラフを提案します。
異種の st グラフに基づいて、空間と時間を介してエンティティ間の異種の相互作用を捕捉するためのさまざまなコンポーネントを備えた新しいナビゲーション ポリシー ネットワーク アーキテクチャである HEIGHT を提案します。
HEIGHT は、アテンション メカニズムを利用して重要なインタラクションに優先順位を付け、リカレント ネットワークを利用して動的シーンの変化を時間の経過とともに追跡し、ロボットが適応的に衝突を回避できるように促します。
広範なシミュレーションと実際の実験を通じて、HEIGHT が困難なナビゲーション シナリオにおける成功と効率の点で最先端のベースラインを上回っていることを実証しました。
さらに、人間や障害物の密度が変化した場合に、私たちのパイプラインが以前の研究よりも優れたゼロショット汎化能力を達成することを実証します。
その他のビデオは https://sites.google.com/view/crowdnav-height/home でご覧いただけます。
要約(オリジナル)
We study the problem of robot navigation in dense and interactive crowds with environmental constraints such as corridors and furniture. Previous methods fail to consider all types of interactions among agents and obstacles, leading to unsafe and inefficient robot paths. In this article, we leverage a graph-based representation of crowded and constrained scenarios and propose a structured framework to learn robot navigation policies with deep reinforcement learning. We first split the representations of different components in the environment and propose a heterogeneous spatio-temporal (st) graph to model distinct interactions among humans, robots, and obstacles. Based on the heterogeneous st-graph, we propose HEIGHT, a novel navigation policy network architecture with different components to capture heterogeneous interactions among entities through space and time. HEIGHT utilizes attention mechanisms to prioritize important interactions and a recurrent network to track changes in the dynamic scene over time, encouraging the robot to avoid collisions adaptively. Through extensive simulation and real-world experiments, we demonstrate that HEIGHT outperforms state-of-the-art baselines in terms of success and efficiency in challenging navigation scenarios. Furthermore, we demonstrate that our pipeline achieves better zero-shot generalization capability than previous works when the densities of humans and obstacles change. More videos are available at https://sites.google.com/view/crowdnav-height/home.
arxiv情報
著者 | Shuijing Liu,Haochen Xia,Fatemeh Cheraghi Pouria,Kaiwen Hong,Neeloy Chakraborty,Katherine Driggs-Campbell |
発行日 | 2024-11-19 00:56:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google