要約
一連の事前定義されたスキルを使用した長老の動きの計画は、ロボット工学とAIの重要な課題です。
この課題に対処するには、スキルの組み合わせを体系的に調査して、タスク解決シーケンスを明らかにし、一般的で学習しやすいスキル(プッシュ、グラッピング)を活用して、目に見えないタスク全体に一般化し、広範なドメインとタスク固有の知識を必要とする象徴的な世界表現に依存することをバイパスする方法が必要です。
大きな進歩にもかかわらず、これらの要素は既存のアプローチに大部分がばらばらにとどまり、複雑で長老の問題に対して堅牢でスケーラブルなソリューションを達成することに重大なギャップを残しています。
この作業では、スキル自体を使用して計画プロセスを導くことにより、これらの要素を統一するスキル中心のフレームワークであるモザイクを提示します。
Mosaicは、発電機が実行可能軌道と世界構成を計算する2つのファミリを使用し、コネクタは境界値の問題を解決し、全体的なタスクの完了に向けて進捗を可能にすることにより、これらの独立して生成されたスキル軌跡をリンクします。
事前定義された開始状態または目標状態からスキルを徐々に発見するという従来のパラダイム(探査を大幅に制限する制限)から脱却することにより、Mosaicは、スキルが本質的に効果的である地域に計画努力を焦点を当てています。
シミュレートされたロボット操作タスクと現実世界のロボット操作タスクの両方におけるモザイクの有効性を実証し、生成的拡散モデル、モーション計画アルゴリズム、操作固有のモデルを組み込んだ多様なスキルセットを使用して、複雑な長期計画問題を解決する能力を示します。
デモと例については、https://skill-mosaic.github.ioにアクセスしてください。
要約(オリジナル)
Planning long-horizon motions using a set of predefined skills is a key challenge in robotics and AI. Addressing this challenge requires methods that systematically explore skill combinations to uncover task-solving sequences, harness generic, easy-to-learn skills (e.g., pushing, grasping) to generalize across unseen tasks, and bypass reliance on symbolic world representations that demand extensive domain and task-specific knowledge. Despite significant progress, these elements remain largely disjoint in existing approaches, leaving a critical gap in achieving robust, scalable solutions for complex, long-horizon problems. In this work, we present MOSAIC, a skill-centric framework that unifies these elements by using the skills themselves to guide the planning process. MOSAIC uses two families of skills: Generators compute executable trajectories and world configurations, and Connectors link these independently generated skill trajectories by solving boundary value problems, enabling progress toward completing the overall task. By breaking away from the conventional paradigm of incrementally discovering skills from predefined start or goal states–a limitation that significantly restricts exploration–MOSAIC focuses planning efforts on regions where skills are inherently effective. We demonstrate the efficacy of MOSAIC in both simulated and real-world robotic manipulation tasks, showcasing its ability to solve complex long-horizon planning problems using a diverse set of skills incorporating generative diffusion models, motion planning algorithms, and manipulation-specific models. Visit https://skill-mosaic.github.io for demonstrations and examples.
arxiv情報
著者 | Itamar Mishani,Yorai Shaoul,Maxim Likhachev |
発行日 | 2025-04-23 14:09:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google