要約
ロボットがデータ効率の良い方法で新しいタスクを学習できるようにすることは、長年の課題です。
一般的な戦略には、以前の経験、特に関連するタスクで収集された遷移データを慎重に活用することが含まれます。
一般的な選択と場所の操作については多くの進歩が遂げられていますが、正確な制御が不可欠な接触豊富なアセンブリタスクを調査している研究ははるかに少ないです。
SRSA(スキル検索とスキル適応)を紹介します。これは、多様なアセンブリタスクのポリシーを含む既存のスキルライブラリを利用することにより、この問題に対処するために設計された新しいフレームワークです。
この課題は、図書館のどのスキルが新しいタスクの微調整に最も関連しているかを特定することにあります。
私たちの重要な仮説は、新しいタスクでより高いゼロショット成功率を示すスキルが、そのタスクで迅速かつ効果的な微調整に適しているということです。
この目的のために、新しいタスクでスキルライブラリのすべてのスキルの転送成功を予測し、この予測を使用してスキル検索プロセスを導くことを提案します。
オブジェクトジオメトリ、物理的ダイナミクス、およびエキスパートアクションの機能を共同でキャプチャして、タスクを表現するフレームワークを確立し、転送成功予測子を効率的に学習できるようにします。
広範な実験は、SRSAが主要なベースラインを大幅に上回ることを示しています。
目に見えないタスクでの検索スキルと微調整スキルの場合、SRSAは成功率の19%の相対的な改善を達成し、ランダムシード全体で2.6倍低い標準偏差を示し、ベースラインと比較して満足のいく成功率に達するために2.4倍少ない遷移サンプルが必要です。
さらに、シミュレーションでSRSAで訓練されたポリシーは、現実世界に展開されたときに90%の平均成功率を達成します。
プロジェクトWebページhttps://srsa2024.github.io/をご覧ください。
要約(オリジナル)
Enabling robots to learn novel tasks in a data-efficient manner is a long-standing challenge. Common strategies involve carefully leveraging prior experiences, especially transition data collected on related tasks. Although much progress has been made for general pick-and-place manipulation, far fewer studies have investigated contact-rich assembly tasks, where precise control is essential. We introduce SRSA (Skill Retrieval and Skill Adaptation), a novel framework designed to address this problem by utilizing a pre-existing skill library containing policies for diverse assembly tasks. The challenge lies in identifying which skill from the library is most relevant for fine-tuning on a new task. Our key hypothesis is that skills showing higher zero-shot success rates on a new task are better suited for rapid and effective fine-tuning on that task. To this end, we propose to predict the transfer success for all skills in the skill library on a novel task, and then use this prediction to guide the skill retrieval process. We establish a framework that jointly captures features of object geometry, physical dynamics, and expert actions to represent the tasks, allowing us to efficiently learn the transfer success predictor. Extensive experiments demonstrate that SRSA significantly outperforms the leading baseline. When retrieving and fine-tuning skills on unseen tasks, SRSA achieves a 19% relative improvement in success rate, exhibits 2.6x lower standard deviation across random seeds, and requires 2.4x fewer transition samples to reach a satisfactory success rate, compared to the baseline. Furthermore, policies trained with SRSA in simulation achieve a 90% mean success rate when deployed in the real world. Please visit our project webpage https://srsa2024.github.io/.
arxiv情報
著者 | Yijie Guo,Bingjie Tang,Iretiayo Akinola,Dieter Fox,Abhishek Gupta,Yashraj Narang |
発行日 | 2025-03-06 15:22:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google