要約
私たちは、以前の研究では、人間と何百もの卓球集会が可能であり、ボールを望ましいターゲットに正確に戻す能力を持っていることが示された、現実世界のロボット学習システムに深く掘り下げます。
このシステムは、高度に最適化された知覚サブシステム、高速低遅延ロボットコントローラー、現実世界での損傷を防ぎ、ゼロショット転送のためのポリシーを訓練できるシミュレーションパラダイム、および自動運転を可能にする自動化された現実世界環境のリセットをまとめます。
物理ロボットのトレーニングと評価。
通常、広く普及していない多くの設計上の決定を含む完全なシステムの説明を補完します。さまざまなレイテンシのソースを軽減することの重要性、トレーニングおよび展開分布の変化、知覚システムの堅牢性、感度の堅牢性の説明の重要性を明確にする研究のコレクションを含む
ポリシーハイパーパラメーター、およびアクションスペースの選択。
システムのコンポーネントと実験結果の詳細を示すビデオは、https://youtu.be/ufcnwjb42i0にあります。
要約(オリジナル)
We present a deep-dive into a real-world robotic learning system that, in previous work, was shown to be capable of hundreds of table tennis rallies with a human and has the ability to precisely return the ball to desired targets. This system puts together a highly optimized perception subsystem, a high-speed low-latency robot controller, a simulation paradigm that can prevent damage in the real world and also train policies for zero-shot transfer, and automated real world environment resets that enable autonomous training and evaluation on physical robots. We complement a complete system description, including numerous design decisions that are typically not widely disseminated, with a collection of studies that clarify the importance of mitigating various sources of latency, accounting for training and deployment distribution shifts, robustness of the perception system, sensitivity to policy hyper-parameters, and choice of action space. A video demonstrating the components of the system and details of experimental results can be found at https://youtu.be/uFcnWjB42I0.
arxiv情報
著者 | David B. D’Ambrosio,Jonathan Abelian,Saminda Abeyruwan,Michael Ahn,Alex Bewley,Justin Boyd,Krzysztof Choromanski,Omar Cortes,Erwin Coumans,Tianli Ding,Wenbo Gao,Laura Graesser,Atil Iscen,Navdeep Jaitly,Deepali Jain,Juhana Kangaspunta,Satoshi Kataoka,Gus Kouretas,Yuheng Kuang,Nevena Lazic,Corey Lynch,Reza Mahjourian,Sherry Q. Moore,Thinh Nguyen,Ken Oslund,Barney J Reed,Krista Reymann,Pannag R. Sanketi,Anish Shankar,Pierre Sermanet,Vikas Sindhwani,Avi Singh,Vincent Vanhoucke,Grace Vesom,Peng Xu |
発行日 | 2025-02-19 18:52:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google