要約
新しい実施形態に対する制御ポリシーの一般化は、ロボット工学におけるスケーラブルで移転可能な学習を可能にする際の根本的な課題のままです。
以前の作品は移動でこれを調査していますが、標準化されたベンチマークがないため、操作タスクのコンテキストでの体系的な研究は限られたままです。
この論文では、2つの基本的なタスクに焦点を当て、多様な範囲の形態学をプッシュすることに焦点を当てた、交差体操作を学習するためのベンチマークを紹介します。
ベンチマークは、3つの軸に沿って一般化をテストするように設計されています:補間(同じリンク構造を共有するロボットカテゴリ内のテストパフォーマンス)、外挿(異なるリンク構造を持つロボットでのテスト)、および構成(リンク構造の組み合わせのテスト)。
ベンチマークでは、さまざまなRLポリシーが複数の形態から学習し、新しい形態に一般化する能力を評価します。
私たちの研究の目的は、形態認識のトレーニングが単一類型のベースラインを上回ることができるかどうか、目に見えない形態へのゼロショットの一般化が実行可能かどうか、そしてこれらのパターンが異なる一般化体制全体にどのように一貫して保持されるかを答えることを目的としています。
結果は、多層学の学習の現在の制限を強調し、建築およびトレーニングの設計の選択が政策の一般化にどのように影響するかについての洞察を提供します。
要約(オリジナル)
Generalizing control policies to novel embodiments remains a fundamental challenge in enabling scalable and transferable learning in robotics. While prior works have explored this in locomotion, a systematic study in the context of manipulation tasks remains limited, partly due to the lack of standardized benchmarks. In this paper, we introduce a benchmark for learning cross-embodiment manipulation, focusing on two foundational tasks-reach and push-across a diverse range of morphologies. The benchmark is designed to test generalization along three axes: interpolation (testing performance within a robot category that shares the same link structure), extrapolation (testing on a robot with a different link structure), and composition (testing on combinations of link structures). On the benchmark, we evaluate the ability of different RL policies to learn from multiple morphologies and to generalize to novel ones. Our study aims to answer whether morphology-aware training can outperform single-embodiment baselines, whether zero-shot generalization to unseen morphologies is feasible, and how consistently these patterns hold across different generalization regimes. The results highlight the current limitations of multi-embodiment learning and provide insights into how architectural and training design choices influence policy generalization.
arxiv情報
著者 | Meenal Parakh,Alexandre Kirchmeyer,Beining Han,Jia Deng |
発行日 | 2025-05-21 00:21:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google