要約
共有環境における人間とロボットのコラボレーションが成功するかどうかは、ロボットが人間の動作にリアルタイムで適応できるかどうかにかかっています。
具体的には、ソーシャル ナビゲーションでは、エージェントは支援できるほど近くにいる必要がありますが、衝突を避けて人間が自由に移動できるように後退する準備ができている必要があります。
人間の軌跡はソーシャル ナビゲーションの重要な手がかりとして現れますが、ロボットの自己中心的な視点からは部分的に観察可能であり、処理するには計算が複雑です。
我々は、社会動態を推測するためにロボットの状態行動履歴に基づいた最初の社会動態適応モデル(SDA)を提案する。
我々は、2 段階の強化学習フレームワークを提案します。最初の段階では、人間の軌跡を社会力学にエンコードすることを学習し、このエンコードされた情報、現在のステータス、および以前のアクションを条件とした動作ポリシーを学習します。
ここでは、軌跡は完全に可視化されており、つまり特権情報とみなされます。
第 2 段階では、トレーニングされたポリシーは軌道に直接アクセスせずに動作します。
代わりに、モデルはリアルタイムの以前の行動とステータスの履歴のみから社会力学を推測します。
新しい Habitat 3.0 プラットフォームでテストされた SDA は、人間の発見と追跡における新しい最先端 (SoA) パフォーマンスを確立しました。
要約(オリジナル)
The success of collaboration between humans and robots in shared environments relies on the robot’s real-time adaptation to human motion. Specifically, in Social Navigation, the agent should be close enough to assist but ready to back up to let the human move freely, avoiding collisions. Human trajectories emerge as crucial cues in Social Navigation, but they are partially observable from the robot’s egocentric view and computationally complex to process. We propose the first Social Dynamics Adaptation model (SDA) based on the robot’s state-action history to infer the social dynamics. We propose a two-stage Reinforcement Learning framework: the first learns to encode the human trajectories into social dynamics and learns a motion policy conditioned on this encoded information, the current status, and the previous action. Here, the trajectories are fully visible, i.e., assumed as privileged information. In the second stage, the trained policy operates without direct access to trajectories. Instead, the model infers the social dynamics solely from the history of previous actions and statuses in real-time. Tested on the novel Habitat 3.0 platform, SDA sets a novel state of the art (SoA) performance in finding and following humans.
arxiv情報
著者 | Luca Scofano,Alessio Sampieri,Tommaso Campari,Valentino Sacco,Indro Spinelli,Lamberto Ballan,Fabio Galasso |
発行日 | 2024-04-17 12:39:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google