要約
現実世界のタスクにおいて人間レベルのスピードとパフォーマンスを達成することは、ロボット研究コミュニティにとって北極星です。
この作品はその目標に向けて一歩を踏み出し、競技卓球においてアマチュアの人間レベルのパフォーマンスに達する初の学習型ロボットエージェントを紹介します。
卓球は肉体的に厳しいスポーツであり、人間のプレーヤーが高度な熟練度に達するには何年ものトレーニングを受ける必要があります。
この論文では、(1) 階層的かつモジュール式のポリシー アーキテクチャに貢献します。このアーキテクチャは、(i) エージェントの能力をモデル化し、シミュレーションと実際のギャップを埋めるのに役立つ詳細なスキル記述子を備えた低レベルのコントローラと、(ii) 高度なスキル記述子で構成されます。
低レベルのスキルを選択するレベル コントローラー、(2) 現実世界に基づいて自動カリキュラムを定義するタスク配分を定義する反復アプローチを含む、ゼロショットのシミュレーションとリアルを可能にするテクニック、(3)
目に見えない敵に対するリアルタイムの適応。
政策のパフォーマンスは、ロボット対人間の 29 試合を通じて評価され、ロボットが 45% (13/29) で勝利しました。
すべての人間は未知のプレイヤーであり、そのスキルレベルは初心者からトーナメントレベルまでさまざまでした。
ロボットは、最も上級のプレーヤーに対してはすべての試合で負けましたが、初心者に対しては 100% の試合に勝ち、中級者に対しては 55% の試合に勝ち、アマチュアの人間レベルのパフォーマンスをしっかりと示しました。
試合のビデオは https://sites.google.com/view/competitive-robot-table-tennis でご覧いただけます。
要約(オリジナル)
Achieving human-level speed and performance on real world tasks is a north star for the robotics research community. This work takes a step towards that goal and presents the first learned robot agent that reaches amateur human-level performance in competitive table tennis. Table tennis is a physically demanding sport which requires human players to undergo years of training to achieve an advanced level of proficiency. In this paper, we contribute (1) a hierarchical and modular policy architecture consisting of (i) low level controllers with their detailed skill descriptors which model the agent’s capabilities and help to bridge the sim-to-real gap and (ii) a high level controller that chooses the low level skills, (2) techniques for enabling zero-shot sim-to-real including an iterative approach to defining the task distribution that is grounded in the real-world and defines an automatic curriculum, and (3) real time adaptation to unseen opponents. Policy performance was assessed through 29 robot vs. human matches of which the robot won 45% (13/29). All humans were unseen players and their skill level varied from beginner to tournament level. Whilst the robot lost all matches vs. the most advanced players it won 100% matches vs. beginners and 55% matches vs. intermediate players, demonstrating solidly amateur human-level performance. Videos of the matches can be viewed at https://sites.google.com/view/competitive-robot-table-tennis
arxiv情報
| 著者 | David B. D’Ambrosio,Saminda Abeyruwan,Laura Graesser,Atil Iscen,Heni Ben Amor,Alex Bewley,Barney J. Reed,Krista Reymann,Leila Takayama,Yuval Tassa,Krzysztof Choromanski,Erwin Coumans,Deepali Jain,Navdeep Jaitly,Natasha Jaques,Satoshi Kataoka,Yuheng Kuang,Nevena Lazic,Reza Mahjourian,Sherry Moore,Kenneth Oslund,Anish Shankar,Vikas Sindhwani,Vincent Vanhoucke,Grace Vesom,Peng Xu,Pannag R. Sanketi |
| 発行日 | 2024-08-07 17:10:55+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google