要約
データからロボットの動作モデルを学習することを提案するデモンストレーションからの学習は、深層生成モデルの出現により人気が高まっています。
この問題は模倣学習、行動クローニング、逆強化学習などの名前で長年研究されてきましたが、古典的な手法は複雑なデータ分布をうまく捉えられないモデルや、多数のデモンストレーションにうまく対応できないモデルに依存してきました。
近年、ロボット学習コミュニティは、深い生成モデルを使用して大規模なデータセットの複雑さを捉えることへの関心が高まっています。
この調査では、ロボット工学における深層生成モデルの使用における昨年の進歩を統一的かつ包括的にレビューすることを目的としています。
エネルギーベースのモデル、拡散モデル、行動価値マップ、敵対的生成ネットワークなど、コミュニティが検討したさまざまなタイプのモデルを紹介します。
また、把握生成から軌道生成、コスト学習まで、深層生成モデルが使用されているさまざまな種類のアプリケーションも紹介します。
生成モデルの最も重要な要素の 1 つは、分布からの一般化です。
私たちの調査では、学習されたモデルの一般化を改善するためにコミュニティが行ったさまざまな決定をレビューします。
最後に、研究の課題を強調し、ロボット工学における深い生成モデルを学習するための将来の方向性をいくつか提案します。
要約(オリジナル)
Learning from Demonstrations, the field that proposes to learn robot behavior models from data, is gaining popularity with the emergence of deep generative models. Although the problem has been studied for years under names such as Imitation Learning, Behavioral Cloning, or Inverse Reinforcement Learning, classical methods have relied on models that don’t capture complex data distributions well or don’t scale well to large numbers of demonstrations. In recent years, the robot learning community has shown increasing interest in using deep generative models to capture the complexity of large datasets. In this survey, we aim to provide a unified and comprehensive review of the last year’s progress in the use of deep generative models in robotics. We present the different types of models that the community has explored, such as energy-based models, diffusion models, action value maps, or generative adversarial networks. We also present the different types of applications in which deep generative models have been used, from grasp generation to trajectory generation or cost learning. One of the most important elements of generative models is the generalization out of distributions. In our survey, we review the different decisions the community has made to improve the generalization of the learned models. Finally, we highlight the research challenges and propose a number of future directions for learning deep generative models in robotics.
arxiv情報
著者 | Julen Urain,Ajay Mandlekar,Yilun Du,Mahi Shafiullah,Danfei Xu,Katerina Fragkiadaki,Georgia Chalvatzaki,Jan Peters |
発行日 | 2024-08-08 11:34:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google