A Comparative Study on State-Action Spaces for Learning Viewpoint Selection and Manipulation with Diffusion Policy

要約

ロボット操作タスクでは、認識のために静的カメラに依存することが多く、特にロボット手術や静的カメラの取り付けが現実的ではない雑然とした環境などのシナリオでは、柔軟性が制限される可能性があります。
理想的には、ロボットが動的な視点と操作のためのポリシーを共同で学習できるようになります。
ただし、この複雑な学習プロセスにどの状態アクション空間が最適であるかは依然として不明です。
動的な視点による操作を可能にし、この政策学習プロセスに対するさまざまな状態行動空間からの影響をよりよく理解するために、政策学習のための状態行動空間と、視点選択を統合した視覚運動政策のパフォーマンスに対するそれらの影響に関する比較研究を実施します。
操作付き。
具体的には、ロボット システムの構成空間、デュアルアーム逆運動学 (IK) ソルバーを使用したエンドエフェクター空間、および視点選択のための回転を最適化するためのルックアット IK ソルバーを使用した縮小されたエンドエフェクター空間を調べます。
また、異なる回転表現を持つバリアントも評価します。
私たちの結果は、オイラー角とルックアット IK を利用するステート アクション スペースが他のスペースと比較して優れたタスク成功率を達成することを示しています。
さらなる分析により、これらのパフォーマンスの違いは、さまざまな状態動作空間と回転表現にわたる高周波成分の固有の変動によって引き起こされることが示唆されています。

要約(オリジナル)

Robotic manipulation tasks often rely on static cameras for perception, which can limit flexibility, particularly in scenarios like robotic surgery and cluttered environments where mounting static cameras is impractical. Ideally, robots could jointly learn a policy for dynamic viewpoint and manipulation. However, it remains unclear which state-action space is most suitable for this complex learning process. To enable manipulation with dynamic viewpoints and to better understand impacts from different state-action spaces on this policy learning process, we conduct a comparative study on the state-action spaces for policy learning and their impacts on the performance of visuomotor policies that integrate viewpoint selection with manipulation. Specifically, we examine the configuration space of the robotic system, the end-effector space with a dual-arm Inverse Kinematics (IK) solver, and the reduced end-effector space with a look-at IK solver to optimize rotation for viewpoint selection. We also assess variants with different rotation representations. Our results demonstrate that state-action spaces utilizing Euler angles with the look-at IK achieve superior task success rates compared to other spaces. Further analysis suggests that these performance differences are driven by inherent variations in the high-frequency components across different state-action spaces and rotation representations.

arxiv情報

著者 Xiatao Sun,Francis Fan,Yinxing Chen,Daniel Rakita
発行日 2024-11-13 02:17:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク