HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments

要約

我々は、通路や家具のような環境制約のある、密集したインタラクティブな群衆におけるロボットナビゲーションの問題を研究している。これまでの手法では、エージェントや障害物間のあらゆる種類の相互作用を考慮することができず、安全で非効率なロボット経路を導く。本稿では、混雑と制約のあるシナリオのグラフベースの表現を活用し、深層強化学習を用いてロボットのナビゲーション方針を学習するための構造化フレームワークを提案する。我々はまず、環境中の異なる構成要素の表現を分割し、人間、ロボット、障害物の間の異なる相互作用をモデル化するための異種時空間(st)グラフを提案する。異種stグラフに基づき、我々は、空間と時間を介したエンティティ間の異種相互作用を捉えるために、異なる構成要素を持つ新しいナビゲーションポリシーネットワークアーキテクチャであるHEIGHTを提案する。HEIGHTは、重要な相互作用に優先順位をつけるための注意機構と、動的なシーンの時間的変化を追跡するためのリカレントネットワークを利用し、ロボットが適応的に衝突を回避するように促す。広範なシミュレーションと実世界での実験を通して、HEIGHTが、困難なナビゲーションシナリオにおいて、成功と効率性の点で最先端のベースラインを上回ることを実証する。さらに、我々のパイプラインは、人間や障害物の密度が変化した場合に、従来の作品よりも優れたゼロショット汎化能力を達成することを実証する。その他のビデオはhttps://sites.google.com/view/crowdnav-height/home。

要約(オリジナル)

We study the problem of robot navigation in dense and interactive crowds with environmental constraints such as corridors and furniture. Previous methods fail to consider all types of interactions among agents and obstacles, leading to unsafe and inefficient robot paths. In this article, we leverage a graph-based representation of crowded and constrained scenarios and propose a structured framework to learn robot navigation policies with deep reinforcement learning. We first split the representations of different components in the environment and propose a heterogeneous spatio-temporal (st) graph to model distinct interactions among humans, robots, and obstacles. Based on the heterogeneous st-graph, we propose HEIGHT, a novel navigation policy network architecture with different components to capture heterogeneous interactions among entities through space and time. HEIGHT utilizes attention mechanisms to prioritize important interactions and a recurrent network to track changes in the dynamic scene over time, encouraging the robot to avoid collisions adaptively. Through extensive simulation and real-world experiments, we demonstrate that HEIGHT outperforms state-of-the-art baselines in terms of success and efficiency in challenging navigation scenarios. Furthermore, we demonstrate that our pipeline achieves better zero-shot generalization capability than previous works when the densities of humans and obstacles change. More videos are available at https://sites.google.com/view/crowdnav-height/home.

arxiv情報

著者 Shuijing Liu,Haochen Xia,Fatemeh Cheraghi Pouria,Kaiwen Hong,Neeloy Chakraborty,Zichao Hu,Joydeep Biswas,Katherine Driggs-Campbell
発行日 2025-05-01 20:03:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク