Mastering Agile Tasks with Limited Trials

要約

具体化されたロボットは、すでに多くの現実世界の操作タスクを処理できます。
ただし、他の特定の現実世界のタスク(たとえば、バスケットボールをフープに撃つ)は非常に機敏で、高い実行精度を必要とし、主に準静的操作タスクのために設計された方法に追加の課題を提示します。
これにより、高価なデータ収集、面倒な報酬設計、または複雑なモーション計画の取り組みが増加します。
ただし、このようなタスクは、人間にとってはるかに挑戦的ではありません。
初心者のバスケットボール選手は、通常、最初の成功したショットを作るために$ \ sim $ 10の試みを必要とし、過去の結果に基づいてモーションを繰り返し調整することにより、$ \ sim $ 10の試みを最初に成功させようとします。
この人間の学習パラダイムに触発されて、私たちは、特定の目標に到達するまで、学習された以前のモーションパターン内での実世界の試験を少数の試験で繰り返し改良する単純でスケーラブルなアプローチである、適応拡散アクションプランニン(ADAP)アルゴリズムを提案します。
実験により、ADAPは、10回未満の試行でバスケットボールをフープに投げるなど、現実世界で直接人間レベルの精度と効率を備えた幅広い目標条件のアジャイルダイナミックタスクを学習し、達成できることが実証されました。
プロジェクトWebサイト:https://adap-robotics.github.io/。

要約(オリジナル)

Embodied robots nowadays can already handle many real-world manipulation tasks. However, certain other real-world tasks (e.g., shooting a basketball into a hoop) are highly agile and require high execution precision, presenting additional challenges for methods primarily designed for quasi-static manipulation tasks. This leads to increased efforts in costly data collection, laborious reward design, or complex motion planning. Such tasks, however, are far less challenging for humans. Say a novice basketball player typically needs only $\sim$10 attempts to make their first successful shot, by roughly imitating a motion prior and then iteratively adjusting their motion based on the past outcomes. Inspired by this human learning paradigm, we propose the Adaptive Diffusion Action Plannin (ADAP) algorithm, a simple & scalable approach which iteratively refines its action plan by few real-world trials within a learned prior motion pattern, until reaching a specific goal. Experiments demonstrated that ADAP can learn and accomplish a wide range of goal-conditioned agile dynamic tasks with human-level precision and efficiency directly in real-world, such as throwing a basketball into the hoop in fewer than 10 trials. Project website:https://adap-robotics.github.io/ .

arxiv情報

著者 Yihang Hu,Pingyue Sheng,Shengjie Wang,Yang Gao
発行日 2025-05-28 03:03:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク