A Game-Theoretic Framework for Joint Forecasting and Planning

要約

人間の存在下でロボットの安全な動作を計画するには、将来の人間の動作の信頼できる予測が必要です。
ただし、以前のインタラクションから最も可能性の高い動作を単に予測するだけでは、安全性は保証されません。
このような予測は、限られたデータセットではめったに観察されない、起こり得るイベントのロングテールをモデル化することができません。
一方で、最悪の場合の動作を計画すると、あからさまに保守的な動作となり、「フリーズしたロボット」になってしまいます。
その代わりに、人間が警戒する反事実を予測する予測を学習することを目指しています。
私たちは、デモンストレーターに対するプランナーのパフォーマンスを報酬とする共同計画と予測のための新しいゲーム理論フレームワークを提案し、エンドツーエンドの方法でモデルをトレーニングするための実用的なアルゴリズムを提示します。
私たちは、群衆ナビゲーション シミュレーターと歩行者の動きの実世界のデータセットにおいて、提案したアルゴリズムがより安全な計画をもたらすことを実証します。
コードは https://github.com/portal-cornell/Game-Theoretic-Forecasting-Planning でリリースされています。

要約(オリジナル)

Planning safe robot motions in the presence of humans requires reliable forecasts of future human motion. However, simply predicting the most likely motion from prior interactions does not guarantee safety. Such forecasts fail to model the long tail of possible events, which are rarely observed in limited datasets. On the other hand, planning for worst-case motions leads to overtly conservative behavior and a “frozen robot”. Instead, we aim to learn forecasts that predict counterfactuals that humans guard against. We propose a novel game-theoretic framework for joint planning and forecasting with the payoff being the performance of the planner against the demonstrator, and present practical algorithms to train models in an end-to-end fashion. We demonstrate that our proposed algorithm results in safer plans in a crowd navigation simulator and real-world datasets of pedestrian motion. We release our code at https://github.com/portal-cornell/Game-Theoretic-Forecasting-Planning.

arxiv情報

著者 Kushal Kedia,Prithwish Dan,Sanjiban Choudhury
発行日 2023-08-11 13:56:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク