要約
私たちは、現実世界のロボット学習システムを詳しく紹介します。これまでの研究では、人間と数百回の卓球ラリーが可能であり、ボールを目的のターゲットに正確に返す能力があることが示されました。
このシステムは、高度に最適化された知覚サブシステム、高速低遅延のロボット コントローラー、現実世界での損傷を防止し、ゼロショット転送のポリシーをトレーニングできるシミュレーション パラダイム、および自律的な動作を可能にする自動化された現実世界の環境リセットをまとめたものです。
物理ロボットのトレーニングと評価。
私たちは、一般に広く普及していない多数の設計上の決定を含む完全なシステムの説明を、さまざまなレイテンシーの原因の軽減、トレーニングと展開の分布の変化、認識システムの堅牢性、影響に対する感度の重要性を明らかにする一連の研究で補完します。
ポリシーのハイパーパラメータとアクションスペースの選択。
システムのコンポーネントと実験結果の詳細を示すビデオは、https://youtu.be/uFcnWjB42I0 でご覧いただけます。
要約(オリジナル)
We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.
arxiv情報
著者 | David B. D’Ambrosio,Jonathan Abelian,Saminda Abeyruwan,Michael Ahn,Alex Bewley,Justin Boyd,Krzysztof Choromanski,Omar Cortes,Erwin Coumans,Tianli Ding,Wenbo Gao,Laura Graesser,Atil Iscen,Navdeep Jaitly,Deepali Jain,Juhana Kangaspunta,Satoshi Kataoka,Gus Kouretas,Yuheng Kuang,Nevena Lazic,Corey Lynch,Reza Mahjourian,Sherry Q. Moore,Thinh Nguyen,Ken Oslund,Barney J Reed,Krista Reymann,Pannag R. Sanketi,Anish Shankar,Pierre Sermanet,Vikas Sindhwani,Avi Singh,Vincent Vanhoucke,Grace Vesom,Peng Xu |
発行日 | 2023-09-06 18:56:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google