DexTOG: Learning Task-Oriented Dexterous Grasp with Language

要約

この研究では、タスク指向の握り(TOG)の分野を器用な手で前進させることを目的とした、新しい言語誘導拡散ベースの学習フレームワークDextogを紹介します。
主に2本指のグリッパーに焦点を当てた既存の方法とは異なり、この研究は器用な操作の複雑さに対処します。ここでは、システムは、特定のタスク制約の下で非ユニークな最適な把持ポーズを識別し、複数の有効なグラスに応じ、グラスプランニングの高度な縁石構成スペースで検索しなければなりません。
提案されているDextogには、拡散ベースの把握ポーズ生成モデルであるDexdiffuと、Dexdiffuをサポートするデータエンジンが含まれています。
Dextogを活用することにより、新しいデータセットDextog-80Kも提案しました。これは、シャドウロボットハンドを使用して開発され、5つのカテゴリの80オブジェクトでさまざまなタスクを実行し、ロボットハンドの器用さとマルチタスク機能を紹介しました。
この研究は、器用なTOGの大幅な飛躍を示すだけでなく、包括的なデータセットとシミュレーションの検証を提供し、ロボット操作研究の新しいベンチマークを設定します。

要約(オリジナル)

This study introduces a novel language-guided diffusion-based learning framework, DexTOG, aimed at advancing the field of task-oriented grasping (TOG) with dexterous hands. Unlike existing methods that mainly focus on 2-finger grippers, this research addresses the complexities of dexterous manipulation, where the system must identify non-unique optimal grasp poses under specific task constraints, cater to multiple valid grasps, and search in a high degree-of-freedom configuration space in grasp planning. The proposed DexTOG includes a diffusion-based grasp pose generation model, DexDiffu, and a data engine to support the DexDiffu. By leveraging DexTOG, we also proposed a new dataset, DexTOG-80K, which was developed using a shadow robot hand to perform various tasks on 80 objects from 5 categories, showcasing the dexterity and multi-tasking capabilities of the robotic hand. This research not only presents a significant leap in dexterous TOG but also provides a comprehensive dataset and simulation validation, setting a new benchmark in robotic manipulation research.

arxiv情報

著者 Jieyi Zhang,Wenqiang Xu,Zhenjun Yu,Pengfei Xie,Tutian Tang,Cewu Lu
発行日 2025-04-06 18:23:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク