要約
実世界の逐次操作タスクを解決するには、ロボットが幅広い状況に適用できるスキルのレパートリーを備えている必要があります。
データ駆動型のアプローチを使用してこのようなスキルを習得するには、膨大で多様なトレーニング データが必要です。これらのトレーニング データは、多くの場合、収集および整理するのに手間がかかり、自明ではありません。
この作業では、アクティブ タスク ランダム化 (ATR) を紹介します。これは、シミュレーションで実行可能な新しいタスクを自動的に作成することにより、シーケンシャル操作のための視覚運動スキルを学習するアプローチです。
トレーニング中、私たちのアプローチは、グラフベースのタスクのパラメーター化を使用してタスクを手続き的に生成します。
サンプリングされたタスクの実現可能性と新規性を適応的に推定するために、各タスクパラメーターをコンパクトな埋め込みにマップするリレーショナルニューラルネットワークを開発します。
私たちのアプローチが、さまざまなオブジェクトでさまざまなシナリオを処理するスキル ポリシーを効率的にトレーニングするための適切なタスクを自動的に作成できることを示します。
タスクプランナーを使用して学習したスキルを構成することにより、シミュレートされた実世界の逐次操作タスクでの方法を評価します。
ベースラインの方法と比較して、私たちのアプローチを使用して習得したスキルは、一貫してより高い成功率を達成しています。
要約(オリジナル)
Solving real-world sequential manipulation tasks requires robots to have a repertoire of skills applicable to a wide range of circumstances. To acquire such skills using data-driven approaches, we need massive and diverse training data which is often labor-intensive and non-trivial to collect and curate. In this work, we introduce Active Task Randomization (ATR), an approach that learns visuomotor skills for sequential manipulation by automatically creating feasible and novel tasks in simulation. During training, our approach procedurally generates tasks using a graph-based task parameterization. To adaptively estimate the feasibility and novelty of sampled tasks, we develop a relational neural network that maps each task parameter into a compact embedding. We demonstrate that our approach can automatically create suitable tasks for efficiently training the skill policies to handle diverse scenarios with a variety of objects. We evaluate our method on simulated and real-world sequential manipulation tasks by composing the learned skills using a task planner. Compared to baseline methods, the skills learned using our approach consistently achieve better success rates.
arxiv情報
著者 | Kuan Fang,Toki Migimatsu,Ajay Mandlekar,Li Fei-Fei,Jeannette Bohg |
発行日 | 2022-11-11 11:24:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google