EvolvingGrasp: Evolutionary Grasp Generation via Efficient Preference Alignment

要約

器用なロボットの手は、低ダイバーシティデータで訓練されたモデルの制限により、複雑な環境で効果的に一般化するのに苦労しています。
ただし、現実の世界は、本質的に無限のシナリオを提示しており、あらゆる可能性のあるバリエーションを説明することは非現実的です。
自然な解決策は、複雑な環境での経験からロボットを学習できること、進化に似たアプローチ、継続的なフィードバックを通じてシステムが改善し、障害と成功の両方から学習し、最適なパフォーマンスに向けて繰り返すことを可能にすることです。
これに動機付けられて、私たちは、効率的な優先順位アライメントを通じて把握パフォーマンスを継続的に強化する進化的把握方法である進化グラスプを提案します。
具体的には、Handpose Wise Preference Optimization(HPO)を導入します。これにより、モデルは、肯定的および否定的なフィードバックの両方からの好みと継続的に整合し、把握戦略を徐々に改良します。
オンライン調整中の効率と信頼性をさらに向上させるために、推論を加速し、優先微調整に必要なタイムステップの数を減らし、プロセス全体の物理的妥当性を確保するHPO内に物理認識の一貫性モデルを組み込みます。
4つのベンチマークデータセットにわたる広範な実験は、成功率とサンプリング効率を把握した方法の最先端のパフォーマンスを示しています。
私たちの結果は、進化graspが進化の把握を可能にし、シミュレーションと実際のシナリオの両方で堅牢で物理的に実現可能で、優先順位付けされた把握を確保できることを検証します。

要約(オリジナル)

Dexterous robotic hands often struggle to generalize effectively in complex environments due to the limitations of models trained on low-diversity data. However, the real world presents an inherently unbounded range of scenarios, making it impractical to account for every possible variation. A natural solution is to enable robots learning from experience in complex environments, an approach akin to evolution, where systems improve through continuous feedback, learning from both failures and successes, and iterating toward optimal performance. Motivated by this, we propose EvolvingGrasp, an evolutionary grasp generation method that continuously enhances grasping performance through efficient preference alignment. Specifically, we introduce Handpose wise Preference Optimization (HPO), which allows the model to continuously align with preferences from both positive and negative feedback while progressively refining its grasping strategies. To further enhance efficiency and reliability during online adjustments, we incorporate a Physics-aware Consistency Model within HPO, which accelerates inference, reduces the number of timesteps needed for preference finetuning, and ensures physical plausibility throughout the process. Extensive experiments across four benchmark datasets demonstrate state of the art performance of our method in grasp success rate and sampling efficiency. Our results validate that EvolvingGrasp enables evolutionary grasp generation, ensuring robust, physically feasible, and preference-aligned grasping in both simulation and real scenarios.

arxiv情報

著者 Yufei Zhu,Yiming Zhong,Zemin Yang,Peishan Cong,Jingyi Yu,Xinge Zhu,Yuexin Ma
発行日 2025-03-19 08:55:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク