要約
機械学習は、人間の行動の単純な予測モデルを超えた、社会に準拠したロボット システムを構築するための強力なツールを提供します。
過去の経験から人間のやりとりを観察して理解することで、データから直接効果的なソーシャル ナビゲーション行動を学習することができます。
この論文では、私たちの目標は、ロボットが人間の行動を妨げない方法で人間の間を移動できるように、社会的に目立たないナビゲーションのためのトレーニングポリシーの方法を開発することです。
私たちは、人間の反事実的な摂動に基づいて、そのような行動の定義を導入します。ロボットが空間に侵入していなかったら、人間は同じように行動しただろうか?
この反事実的な摂動を最小限に抑えることで、共有空間における人間の自然な行動を変えないような行動をロボットに誘導することができます。
この原則を具体化するには、人間の行動への影響を最小限に抑えるためのトレーニング ポリシーが必要であり、そのためには、ロボットが存在する場合の人間の行動をモデル化できるデータが必要になります。
したがって、私たちのアプローチは 2 つの重要な貢献に基づいています。
まず、屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集します。
次に、このデータセットを利用して、反事実の混乱を最小限に抑えるポリシーをトレーニングします。
私たちは補足ビデオを提供し、プロジェクト ページでこの種としては最大のビジュアル ナビゲーション データセットを公開しています。
要約(オリジナル)
Machine learning provides a powerful tool for building socially compliant robotic systems that go beyond simple predictive models of human behavior. By observing and understanding human interactions from past experiences, learning can enable effective social navigation behaviors directly from data. In this paper, our goal is to develop methods for training policies for socially unobtrusive navigation, such that robots can navigate among humans in ways that don’t disturb human behavior. We introduce a definition for such behavior based on the counterfactual perturbation of the human: if the robot had not intruded into the space, would the human have acted in the same way? By minimizing this counterfactual perturbation, we can induce robots to behave in ways that do not alter the natural behavior of humans in the shared space. Instantiating this principle requires training policies to minimize their effect on human behavior, and this in turn requires data that allows us to model the behavior of humans in the presence of robots. Therefore, our approach is based on two key contributions. First, we collect a large dataset where an indoor mobile robot interacts with human bystanders. Second, we utilize this dataset to train policies that minimize counterfactual perturbation. We provide supplementary videos and make publicly available the largest-of-its-kind visual navigation dataset on our project page.
arxiv情報
著者 | Noriaki Hirose,Dhruv Shah,Ajay Sridhar,Sergey Levine |
発行日 | 2023-07-28 00:32:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google