要約
ヒューマノイド全身制御では、ナビゲーション、局所操作、卓上操作などの多様なタスクに適応する必要があり、それぞれが異なる制御モードを必要とします。
たとえば、ナビゲーションはルート速度追跡に依存していますが、卓上操作は上半身の関節角追跡を優先します。
通常、既存のアプローチは、特定のコマンドスペースに合わせて調整された個々のポリシーをトレーニングし、モード全体で転送可能性を制限します。
フルボディのキネマティックモーション模倣は、これらすべてのタスクの共通の抽象化として機能し、全身制御の複数のモードを学習するための汎用運動能力を提供できるという重要な洞察を提示します。
これに基づいて、多様なコントロールモードを統一ポリシーに統合するマルチモードポリシー蒸留フレームワークであるHover(Humanoid Versatile Controller)を提案します。
ホバーは、それぞれの明確な利点を維持しながら、制御モード間のシームレスな遷移を可能にし、幅広いモードにわたってヒューマノイド制御のための堅牢でスケーラブルなソリューションを提供します。
各制御モードのポリシー再訓練の必要性を排除することにより、当社のアプローチは将来のヒューマノイドアプリケーションの効率と柔軟性を向上させます。
要約(オリジナル)
Humanoid whole-body control requires adapting to diverse tasks such as navigation, loco-manipulation, and tabletop manipulation, each demanding a different mode of control. For example, navigation relies on root velocity tracking, while tabletop manipulation prioritizes upper-body joint angle tracking. Existing approaches typically train individual policies tailored to a specific command space, limiting their transferability across modes. We present the key insight that full-body kinematic motion imitation can serve as a common abstraction for all these tasks and provide general-purpose motor skills for learning multiple modes of whole-body control. Building on this, we propose HOVER (Humanoid Versatile Controller), a multi-mode policy distillation framework that consolidates diverse control modes into a unified policy. HOVER enables seamless transitions between control modes while preserving the distinct advantages of each, offering a robust and scalable solution for humanoid control across a wide range of modes. By eliminating the need for policy retraining for each control mode, our approach improves efficiency and flexibility for future humanoid applications.
arxiv情報
著者 | Tairan He,Wenli Xiao,Toru Lin,Zhengyi Luo,Zhenjia Xu,Zhenyu Jiang,Jan Kautz,Changliu Liu,Guanya Shi,Xiaolong Wang,Linxi Fan,Yuke Zhu |
発行日 | 2025-03-06 07:50:56+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google