SACSoN: Scalable Autonomous Control for Social Navigation


機械学習は、人間の行動の単純な予測モデルを超えた、社会に準拠したロボット システムを構築するための強力なツールを提供します。
過去の経験から人間のやりとりを観察して理解することで、データから直接効果的なソーシャル ナビゲーション行動を学習することができます。
この原則を具体化するには、人間の行動への影響を最小限に抑えるためのトレーニング ポリシーが必要であり、そのためには、ロボットが存在する場合の人間の行動をモデル化できるデータが必要になります。
したがって、私たちのアプローチは 2 つの重要な貢献に基づいています。
私たちは補足ビデオを提供し、プロジェクト ページでこの種としては最大のビジュアル ナビゲーション データセットを公開しています。


Machine learning provides a powerful tool for building socially compliant robotic systems that go beyond simple predictive models of human behavior. By observing and understanding human interactions from past experiences, learning can enable effective social navigation behaviors directly from data. In this paper, our goal is to develop methods for training policies for socially unobtrusive navigation, such that robots can navigate among humans in ways that don’t disturb human behavior. We introduce a definition for such behavior based on the counterfactual perturbation of the human: if the robot had not intruded into the space, would the human have acted in the same way? By minimizing this counterfactual perturbation, we can induce robots to behave in ways that do not alter the natural behavior of humans in the shared space. Instantiating this principle requires training policies to minimize their effect on human behavior, and this in turn requires data that allows us to model the behavior of humans in the presence of robots. Therefore, our approach is based on two key contributions. First, we collect a large dataset where an indoor mobile robot interacts with human bystanders. Second, we utilize this dataset to train policies that minimize counterfactual perturbation. We provide supplementary videos and make publicly available the largest-of-its-kind visual navigation dataset on our project page.


著者 Noriaki Hirose,Dhruv Shah,Ajay Sridhar,Sergey Levine
発行日 2023-10-25 20:25:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク