要約
あなたのヒューマノイドは、滴をこぼさずに、あなたにビールを一杯手渡すことができますか?
ヒューマノイドは、踊り、パッケージの配信、荒れた地形の移動、運動中のきめの細かい制御などの派手なデモでますます紹介されていますが、依然として大きな課題です。
特に、タスクのダイナミクスの基本的な不一致のために、歩行中に充填エンドエフェクター(EE)を安定化することは解決にはほど遠いものです。Locomotionは、速い速度で堅牢な制御を要求しますが、EEの安定化には迅速で高度の高度の修正が必要です。
これに対処するために、softaを提案します。ソレッカは、上半身と下半身のコントロールを異なる周波数および異なる報酬で動作する別々のエージェントに切り離す遅い速い2つの2つのフレームワークであると提案します。
この時間的および客観的な分離は、ポリシーの干渉を軽減し、調整された全身行動を可能にします。
Softaは、正確なEEコントロールの場合は100 Hzで上半身のアクションを実行し、堅牢な歩行では50 Hzで下半身のアクションを実行します。
ベースラインと比較してEE加速度を2〜5倍減らし、人間レベルの安定性にはるかに近いことで、ほぼフルカップを運ぶ、移動中の安定したビデオのキャプチャ、EEの安定性による乱れの拒絶などの繊細なタスクを可能にします。
要約(オリジナル)
Can your humanoid walk up and hand you a full cup of beer, without spilling a drop? While humanoids are increasingly featured in flashy demos like dancing, delivering packages, traversing rough terrain, fine-grained control during locomotion remains a significant challenge. In particular, stabilizing a filled end-effector (EE) while walking is far from solved, due to a fundamental mismatch in task dynamics: locomotion demands slow-timescale, robust control, whereas EE stabilization requires rapid, high-precision corrections. To address this, we propose SoFTA, a Slow-Fast TwoAgent framework that decouples upper-body and lower-body control into separate agents operating at different frequencies and with distinct rewards. This temporal and objective separation mitigates policy interference and enables coordinated whole-body behavior. SoFTA executes upper-body actions at 100 Hz for precise EE control and lower-body actions at 50 Hz for robust gait. It reduces EE acceleration by 2-5x relative to baselines and performs much closer to human-level stability, enabling delicate tasks such as carrying nearly full cups, capturing steady video during locomotion, and disturbance rejection with EE stability.
arxiv情報
著者 | Yitang Li,Yuanhang Zhang,Wenli Xiao,Chaoyi Pan,Haoyang Weng,Guanqi He,Tairan He,Guanya Shi |
発行日 | 2025-05-30 04:18:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google