Robot Manipulation Task Learning by Leveraging SE(3) Group Invariance and Equivariance

要約

この論文では、環境との相互作用を伴うロボット操作タスクの学習における伝達性を高めるために、SE(3) 群の不変性と等変性を活用する微分幾何制御アプローチを紹介します。
具体的には、操作タスク定義の任意の SE(3) 変換の下で不変のままである制御則と学習表現フレームワークを採用します。
さらに、制御則と学習表現フレームワークは、空間フレームに対して表現された場合、SE(3) 等変であることが示されています。
提案されたアプローチは、最近発表された幾何学的インピーダンス制御 (GIC) と学習可変インピーダンス制御フレームワークを組み合わせた利用に基づいており、ゲイン スケジューリング ポリシーは専門家のデモンストレーションから教師あり学習方式でトレーニングされます。
幾何学的に一貫したエラー ベクトル (GCEV) がニューラル ネットワークに供給され、任意の平行移動や回転に対して不変のゲイン スケジューリング ポリシーが実現されます。
私たちが提案した制御および学習フレームワークと、デカルト誤差ベクトルベースのゲイン スケジューリング ポリシーを備えたよく知られたデカルト空間学習インピーダンス制御との比較により、私たちが提案したアプローチの学習伝達性が大幅に優れていることが確認されます。
ペグインホールタスクのハードウェア実装は、提案されたアプローチの学習の伝達可能性と実現可能性を検証するために実行されます。

要約(オリジナル)

This paper presents a differential geometric control approach that leverages SE(3) group invariance and equivariance to increase transferability in learning robot manipulation tasks that involve interaction with the environment. Specifically, we employ a control law and a learning representation framework that remain invariant under arbitrary SE(3) transformations of the manipulation task definition. Furthermore, the control law and learning representation framework are shown to be SE(3) equivariant when represented relative to the spatial frame. The proposed approach is based on utilizing a recently presented geometric impedance control (GIC) combined with a learning variable impedance control framework, where the gain scheduling policy is trained in a supervised learning fashion from expert demonstrations. A geometrically consistent error vector (GCEV) is fed to a neural network to achieve a gain scheduling policy that remains invariant to arbitrary translation and rotations. A comparison of our proposed control and learning framework with a well-known Cartesian space learning impedance control, equipped with a Cartesian error vector-based gain scheduling policy, confirms the significantly superior learning transferability of our proposed approach. A hardware implementation on a peg-in-hole task is conducted to validate the learning transferability and feasibility of the proposed approach.

arxiv情報

著者 Joohwan Seo,Nikhil Potu Surya Prakash,Xiang Zhang,Changhao Wang,Jongeun Choi,Masayoshi Tomizuka,Roberto Horowitz
発行日 2023-08-29 02:27:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY パーマリンク