要約
このペーパーでは、実際のゲームプレイ録音から直接ヒューマノイドロボットサッカーのエンドツーエンド制御ポリシーを学習するように設計された変圧器ベースの拡散モデルであるSoccerDiffusionを紹介します。
Robocup競争から収集されたデータを使用して、モデルは、ビジョン、固有受容、ゲーム状態を含むマルチモーダルセンサー入力からの共同コマンド軌道を予測します。
蒸留技術を採用して、マルチステップ拡散プロセスを単一のステップに削減する埋め込みプラットフォームでのリアルタイム推論を可能にします。
我々の結果は、シミュレーションと物理ロボットの両方で、ウォーキング、キック、転倒の回復など、複雑な動きの動作を複製するモデルの能力を示しています。
高レベルの戦術的行動はまだ限られたままですが、この作業は、その後の強化学習または好みの最適化方法のための堅牢な基盤を提供します。
https://bit-bots.github.io/soccerdifusionの下で、データセット、前提型モデル、およびコードをリリースします
要約(オリジナル)
This paper introduces SoccerDiffusion, a transformer-based diffusion model designed to learn end-to-end control policies for humanoid robot soccer directly from real-world gameplay recordings. Using data collected from RoboCup competitions, the model predicts joint command trajectories from multi-modal sensor inputs, including vision, proprioception, and game state. We employ a distillation technique to enable real-time inference on embedded platforms that reduces the multi-step diffusion process to a single step. Our results demonstrate the model’s ability to replicate complex motion behaviors such as walking, kicking, and fall recovery both in simulation and on physical robots. Although high-level tactical behavior remains limited, this work provides a robust foundation for subsequent reinforcement learning or preference optimization methods. We release the dataset, pretrained models, and code under: https://bit-bots.github.io/SoccerDiffusion
arxiv情報
著者 | Florian Vahl,Jörn Griepenburg,Jan Gutsche,Jasper Güldenstein,Jianwei Zhang |
発行日 | 2025-04-29 14:21:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google