Fourier Transporter: Bi-Equivariant Robotic Manipulation in 3D


多くの複雑なロボット操作タスクは、一連のピック アンド プレイス アクションとして分解できます。
多くの異なる開始条件にわたってこのシーケンスを学習するようにロボット エージェントをトレーニングするには、通常、特に 3D 環境では多くの反復またはデモンストレーションが必要です。
この研究では、ピックプレイス問題における $\SE(d)\times\SE(d)$ の二重対称性を活用して、より高いサンプル効率を達成するフーリエ トランスポーター (\ours{}) を提案します。
\ours{} は、新しい環境でのピック プレイス アクションを予測するために、専門家のデモンストレーションを使用してトレーニングされた開ループ動作のクローン作成手法です。
\ours{} は、ピック アンド プレイスのアクションの対称性を独立して組み込むように制約されます。
私たちは、提案したネットワークを RLbench ベンチマークでテストし、さまざまなタスクにわたって最先端の結果を達成しました。


Many complex robotic manipulation tasks can be decomposed as a sequence of pick and place actions. Training a robotic agent to learn this sequence over many different starting conditions typically requires many iterations or demonstrations, especially in 3D environments. In this work, we propose Fourier Transporter (\ours{}) which leverages the two-fold $\SE(d)\times\SE(d)$ symmetry in the pick-place problem to achieve much higher sample efficiency. \ours{} is an open-loop behavior cloning method trained using expert demonstrations to predict pick-place actions on new environments. \ours{} is constrained to incorporate symmetries of the pick and place actions independently. Our method utilizes a fiber space Fourier transformation that allows for memory-efficient construction. We test our proposed network on the RLbench benchmark and achieve state-of-the-art results across various tasks.


著者 Haojie Huang,Owen Howell,Xupeng Zhu,Dian Wang,Robin Walters,Robert Platt
発行日 2024-01-22 15:38:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.RO パーマリンク