Morphologically Symmetric Reinforcement Learning for Ambidextrous Bimanual Manipulation

要約

人間は自然に総操作スキルで両側対称性を示し、左手と右手の間の簡単な行動を楽に反映しています。
また、両側の対称性を特徴とするバイアルロボットは、このプロパティを同様に活用して、どちらの手でもタスクを実行する必要があります。
多くの場合、優れた器用なスキルのために支配的な手を支持する人間とは異なり、ロボットは理想的には、平等な習熟度で両手利きの操作を実行する必要があります。
この目的のために、ロボットの固有の両側対称性を誘導バイアスとして活用する両手利きの二操剤の強化学習フレームワークであるSymdex(Symmetric Dexterity)を紹介します。
Symdexは、複雑な双方向の操作タスクを、それぞれの専用のポリシーと列車の列車に分解します。
等量性ニューラルネットワークを介して両側対称性を活用することにより、片方の腕からの経験は、反対側の腕によって本質的に活用されます。
次に、サブタスクポリシーを、ハンドタスクの割り当てとは無関係のグローバルな両手利きのポリシーに蒸留します。
6つの挑戦的なシミュレートされた操作タスクでSymdexを評価し、そのうちの2つで実世界の展開を成功させます。
私たちのアプローチは、左手と右手が異なる役割を実行する複雑なタスクのベースラインを強く上回ります。
さらに、Symdexのスケーラビリティを4アーム操作セットアップに拡張することにより、Symdexのスケーラビリティを実証します。このセットアップでは、対称性が認識しているポリシーにより、効果的なマルチアームコラボレーションと調整が可能になります。
我々の結果は、政策学習における帰納的バイアスとしての構造対称性が、多様な器用な操作タスク全体のサンプル効率、堅牢性、および一般化をどのように高めるかを強調しています。

要約(オリジナル)

Humans naturally exhibit bilateral symmetry in their gross manipulation skills, effortlessly mirroring simple actions between left and right hands. Bimanual robots-which also feature bilateral symmetry-should similarly exploit this property to perform tasks with either hand. Unlike humans, who often favor a dominant hand for fine dexterous skills, robots should ideally execute ambidextrous manipulation with equal proficiency. To this end, we introduce SYMDEX (SYMmetric DEXterity), a reinforcement learning framework for ambidextrous bi-manipulation that leverages the robot’s inherent bilateral symmetry as an inductive bias. SYMDEX decomposes complex bimanual manipulation tasks into per-hand subtasks and trains dedicated policies for each. By exploiting bilateral symmetry via equivariant neural networks, experience from one arm is inherently leveraged by the opposite arm. We then distill the subtask policies into a global ambidextrous policy that is independent of the hand-task assignment. We evaluate SYMDEX on six challenging simulated manipulation tasks and demonstrate successful real-world deployment on two of them. Our approach strongly outperforms baselines on complex task in which the left and right hands perform different roles. We further demonstrate SYMDEX’s scalability by extending it to a four-arm manipulation setup, where our symmetry-aware policies enable effective multi-arm collaboration and coordination. Our results highlight how structural symmetry as inductive bias in policy learning enhances sample efficiency, robustness, and generalization across diverse dexterous manipulation tasks.

arxiv情報

著者 Zechu Li,Yufeng Jin,Daniel Ordonez Apraez,Claudio Semini,Puze Liu,Georgia Chalvatzaki
発行日 2025-05-08 14:29:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク