FoAM: Foresight-Augmented Multi-Task Imitation Policy for Robotic Manipulation

要約

マルチタスク模倣学習(MTIL)は、単一のポリシーを使用してエージェントがさまざまなタスクを実行できるようにすることにより、ロボット操作に大きな可能性を示しています。
これにより、ポリシーの展開が簡素化され、さまざまなシナリオでエージェントの適応性が向上します。
ただし、アクションの信頼性を維持する(例えば、名目上のタスクの軌跡から逸脱する異常なアクションシーケンスを回避する)、いくつかの専門家のデモンストレーションで目に見えないタスクに一般化するなど、重要な課題が残っています。
これらの課題に対処するために、先見の明のある操作ポリシー(FOAM)を紹介します。これは、入力としてマルチモーダル目標条件の使用を開拓し、一般的なアクションの再構成に加えて先見の明の増加を導入する新しいMTILポリシーです。
フォームにより、エージェントはその行動の視覚的結果(状態)について推論し、微妙なタスクのバリエーションをキャプチャするより表現力のある埋め込みを学ぶことができます。
シミュレーションと現実世界の設定における100を超えるタスクに関する広範な実験は、フォームがMTILポリシーのパフォーマンスを大幅に向上させ、最先端のベースラインを成功率が最大41%上回ることを示しています。
一方、合計10のシナリオと、操作ポリシートレーニングと評価のために設計された80を超える挑戦的なタスクを含むシミュレーションスイートをリリースしました。
プロジェクトの詳細については、プロジェクトHomepage projfoam.github.ioを参照してください。

要約(オリジナル)

Multi-task imitation learning (MTIL) has shown significant potential in robotic manipulation by enabling agents to perform various tasks using a single policy. This simplifies the policy deployment and enhances the agent’s adaptability across different scenarios. However, key challenges remain, such as maintaining action reliability (e.g., avoiding abnormal action sequences that deviate from nominal task trajectories) and generalizing to unseen tasks with a few expert demonstrations. To address these challenges, we introduce the Foresight-Augmented Manipulation Policy (FoAM), a novel MTIL policy that pioneers the use of multi-modal goal condition as input and introduces a foresight augmentation in addition to the general action reconstruction. FoAM enables the agent to reason about the visual consequences (states) of its actions and learn more expressive embedding that captures nuanced task variations. Extensive experiments on over 100 tasks in simulation and real-world settings demonstrate that FoAM significantly enhances MTIL policy performance, outperforming state-of-the-art baselines by up to 41% in success rate. Meanwhile, we released our simulation suites, including a total of 10 scenarios and over 80 challenging tasks designed for manipulation policy training and evaluation. See the project homepage projFoAM.github.io for project details.

arxiv情報

著者 Litao Liu,Wentao Wang,Yifan Han,Zhuoli Xie,Pengfei Yi,Junyan Li,Yi Qin,Wenzhao Lian
発行日 2025-03-26 06:33:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク