Following the Human Thread in Social Navigation

要約

共有環境での人間とロボットの間のコラボレーションの成功は、ロボットの人間の動きへのリアルタイムの適応に依存しています。
具体的には、ソーシャルナビゲーションでは、エージェントは支援するのに十分なほど近づいている必要がありますが、衝突を避けて人間を自由に動かすためにバックアップする準備ができている必要があります。
人間の軌跡は、社会的航法で重要な手がかりとして現れますが、それらはロボットのエゴセントリックな見解から部分的に観察可能であり、計算的に複雑です。
社会的ダイナミクスを推測するために、ロボットの状態行動履歴に基づいて、最初の社会的ダイナミクス適応モデル(SDA)を提示します。
2段階の強化学習フレームワークを提案します。最初の学習は、人間の軌跡を社会的ダイナミクスにエンコードすることを学び、このエンコードされた情報、現在のステータス、および以前のアクションに条件付けられたモーションポリシーを学習します。
ここでは、軌跡が完全に見える、つまり特権情報として想定されています。
第2段階では、訓練されたポリシーは軌道に直接アクセスすることなく動作します。
代わりに、モデルは、以前のアクションとステータスの歴史とリアルタイムでのみソーシャルダイナミクスを推進します。
新しいHabitat 3.0プラットフォームでテストされたSDAは、人間の発見とフォローにおいて、新しい最先端(SOTA)のパフォーマンスを設定しています。
コードはhttps://github.com/l-scofano/sdaにあります。

要約(オリジナル)

The success of collaboration between humans and robots in shared environments relies on the robot’s real-time adaptation to human motion. Specifically, in Social Navigation, the agent should be close enough to assist but ready to back up to let the human move freely, avoiding collisions. Human trajectories emerge as crucial cues in Social Navigation, but they are partially observable from the robot’s egocentric view and computationally complex to process. We present the first Social Dynamics Adaptation model (SDA) based on the robot’s state-action history to infer the social dynamics. We propose a two-stage Reinforcement Learning framework: the first learns to encode the human trajectories into social dynamics and learns a motion policy conditioned on this encoded information, the current status, and the previous action. Here, the trajectories are fully visible, i.e., assumed as privileged information. In the second stage, the trained policy operates without direct access to trajectories. Instead, the model infers the social dynamics solely from the history of previous actions and statuses in real-time. Tested on the novel Habitat 3.0 platform, SDA sets a novel state-of-the-art (SotA) performance in finding and following humans. The code can be found at https://github.com/L-Scofano/SDA.

arxiv情報

著者 Luca Scofano,Alessio Sampieri,Tommaso Campari,Valentino Sacco,Indro Spinelli,Lamberto Ballan,Fabio Galasso
発行日 2025-02-25 10:43:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク