要約
接触が多いタスクは、接触の複雑なダイナミクスと正確な制御の必要性により、ロボット操作ポリシーにとって大きな課題となる。視覚に基づく方針は、一般的に力/トルク情報のような重要な接触フィードバックモダリティが欠如しているため、このようなタスクに必要なスキルに苦戦することが多い。この問題に対処するために、我々は、接触が多い操作のパフォーマンスを向上させるために、高周波の力/トルクセンシングと視覚入力を組み合わせた力認識反応型ポリシーであるFoARを提案する。FoARは、RISEポリシーの上に構築され、未来接触予測器によって導かれるマルチモーダル特徴融合メカニズムを組み込み、非接触フェーズと接触フェーズの間で力/トルクデータの使用量を動的に調整することを可能にする。また、そのリアクティブ制御戦略により、FoARは単純な位置制御によって接触が多いタスクを正確に達成することができます。実験結果は、FoARが予期せぬ動的外乱の下でも頑健な性能を維持しながら、様々な困難な接触リッチタスクにおいて全てのベースラインを大幅に上回ることを実証している。プロジェクトウェブサイト: https://tonyfang.net/FoAR/
要約(オリジナル)
Contact-rich tasks present significant challenges for robotic manipulation policies due to the complex dynamics of contact and the need for precise control. Vision-based policies often struggle with the skill required for such tasks, as they typically lack critical contact feedback modalities like force/torque information. To address this issue, we propose FoAR, a force-aware reactive policy that combines high-frequency force/torque sensing with visual inputs to enhance the performance in contact-rich manipulation. Built upon the RISE policy, FoAR incorporates a multimodal feature fusion mechanism guided by a future contact predictor, enabling dynamic adjustment of force/torque data usage between non-contact and contact phases. Its reactive control strategy also allows FoAR to accomplish contact-rich tasks accurately through simple position control. Experimental results demonstrate that FoAR significantly outperforms all baselines across various challenging contact-rich tasks while maintaining robust performance under unexpected dynamic disturbances. Project website: https://tonyfang.net/FoAR/
arxiv情報
| 著者 | Zihao He,Hongjie Fang,Jingjing Chen,Hao-Shu Fang,Cewu Lu |
| 発行日 | 2025-05-02 17:49:12+00:00 |
| arxivサイト | arxiv_id(pdf) |