要約
ヒューマノイドの全身制御では、ナビゲーション、移動操作、卓上操作などのさまざまなタスクに適応する必要があり、それぞれに異なる制御モードが必要です。
たとえば、ナビゲーションは根元速度の追跡に依存しますが、テーブルトップ操作では上半身の関節角度の追跡が優先されます。
既存のアプローチは通常、特定のコマンド空間に合わせて調整された個別のポリシーをトレーニングするため、モード間での転送可能性が制限されます。
我々は、全身の運動学的動作の模倣がこれらすべてのタスクの共通の抽象化として機能し、全身制御の複数のモードを学習するための汎用運動スキルを提供できるという重要な洞察を提示します。
これに基づいて、多様な制御モードを統一ポリシーに統合するマルチモード ポリシー抽出フレームワークである HOVER (Humanoid Versatile Controller) を提案します。
HOVER は、それぞれの明確な利点を維持しながら制御モード間のシームレスな移行を可能にし、幅広いモードにわたるヒューマノイド制御のための堅牢でスケーラブルなソリューションを提供します。
各制御モードのポリシーの再トレーニングの必要性を排除することで、私たちのアプローチは将来の人型アプリケーションの効率と柔軟性を向上させます。
要約(オリジナル)
Humanoid whole-body control requires adapting to diverse tasks such as navigation, loco-manipulation, and tabletop manipulation, each demanding a different mode of control. For example, navigation relies on root velocity tracking, while tabletop manipulation prioritizes upper-body joint angle tracking. Existing approaches typically train individual policies tailored to a specific command space, limiting their transferability across modes. We present the key insight that full-body kinematic motion imitation can serve as a common abstraction for all these tasks and provide general-purpose motor skills for learning multiple modes of whole-body control. Building on this, we propose HOVER (Humanoid Versatile Controller), a multi-mode policy distillation framework that consolidates diverse control modes into a unified policy. HOVER enables seamless transitions between control modes while preserving the distinct advantages of each, offering a robust and scalable solution for humanoid control across a wide range of modes. By eliminating the need for policy retraining for each control mode, our approach improves efficiency and flexibility for future humanoid applications.
arxiv情報
著者 | Tairan He,Wenli Xiao,Toru Lin,Zhengyi Luo,Zhenjia Xu,Zhenyu Jiang,Jan Kautz,Changliu Liu,Guanya Shi,Xiaolong Wang,Linxi Fan,Yuke Zhu |
発行日 | 2024-10-28 17:15:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google