Dreaming to Assist: Learning to Align with Human Objectives for Shared Control in High-Speed Racing

要約

マルチカーレースなど、素早いダイナミクスと戦術的決定を伴う領域で効果的な人間とロボットのチームを組むには、緊密な調整が必要です。
このような設定では、ロボットのチームメイトは、人間のチームメイトの戦術目標の合図に反応して、目標と一致する方法で支援する必要があります(障害物の周囲を左右にナビゲートするなど)。
この課題に対処するために、人間の目的と価値関数を推測できるリッチワールド モデルと、特定の人間のチームメイトに適切な専門家の支援を提供する支援エージェントを組み合わせたフレームワークである Dream2Assist を紹介します。
私たちのアプローチは、人間の意図を明示的に推測するリカレント状態空間モデルに基づいて構築されており、支援エージェントが人間に合わせたアクションを選択できるようにし、流動的なチームインタラクションを可能にします。
私たちは、「後ろに留まる」や「追い抜く」などの相互に排他的な目標を追求する合成人間のドライバー集団を使用して、高速レース領域でのアプローチを実証します。
人間とロボットを組み合わせたチームは、その行動と人間の行動を融合すると、合成人間単独やいくつかのベースライン支援戦略よりも優れたパフォーマンスを示し、インテントコンディショニングによりタスク実行中に人間の好みに従うことが可能になり、パフォーマンスの向上につながることを示します。
人間の目的を満たしながらパフォーマンスを発揮すること。

要約(オリジナル)

Tight coordination is required for effective human-robot teams in domains involving fast dynamics and tactical decisions, such as multi-car racing. In such settings, robot teammates must react to cues of a human teammate’s tactical objective to assist in a way that is consistent with the objective (e.g., navigating left or right around an obstacle). To address this challenge, we present Dream2Assist, a framework that combines a rich world model able to infer human objectives and value functions, and an assistive agent that provides appropriate expert assistance to a given human teammate. Our approach builds on a recurrent state space model to explicitly infer human intents, enabling the assistive agent to select actions that align with the human and enabling a fluid teaming interaction. We demonstrate our approach in a high-speed racing domain with a population of synthetic human drivers pursuing mutually exclusive objectives, such as ‘stay-behind’ and ‘overtake’. We show that the combined human-robot team, when blending its actions with those of the human, outperforms the synthetic humans alone as well as several baseline assistance strategies, and that intent-conditioning enables adherence to human preferences during task execution, leading to improved performance while satisfying the human’s objective.

arxiv情報

著者 Jonathan DeCastro,Andrew Silva,Deepak Gopinath,Emily Sumner,Thomas M. Balch,Laporsha Dees,Guy Rosman
発行日 2024-10-14 01:00:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.RO パーマリンク