要約
動的環境のロボットには、アジャイル計画をサポートするために、オブジェクトが環境でどのように移動するかの高速で正確なモデルが必要です。
Ping Pongなどのスポーツでは、分析モデルがしばしば、複雑な空力、弾力性のある行動、およびスライド摩擦のモデリングとローリング摩擦のモデリングの課題により、スピンでボール軌道を正確に予測するのに苦労しています。
一方、データ駆動型の方法の約束にもかかわらず、機械学習は、正確な入力なしで正確で一貫した予測を行うのに苦労しています。
この論文では、ダイナミクスモデルと因子グラフ推定器を共同でトレーニングできるエンドツーエンドの学習フレームワークを提案します。
当社のアプローチは、グラムシュミット(GS)プロセスを活用して、ロトロ翻訳不変表現を抽出してモデルのパフォーマンスを改善し、データ増強法と比較して検証エラーをさらに減らすことができます。
さらに、レイヤー接続で自己培養バイパスを使用して非線形性を高めるネットワークアーキテクチャを提案します。
これらの新しい方法を活用することにより、提案されたアプローチは、最初のバウンス後の頂点で37.2 mmのパドル半径、2回目のバウンスの71.5 mmのRMSEでボールの位置を予測します。
要約(オリジナル)
Robots in dynamic environments need fast, accurate models of how objects move in their environments to support agile planning. In sports such as ping pong, analytical models often struggle to accurately predict ball trajectories with spins due to complex aerodynamics, elastic behaviors, and the challenges of modeling sliding and rolling friction. On the other hand, despite the promise of data-driven methods, machine learning struggles to make accurate, consistent predictions without precise input. In this paper, we propose an end-to-end learning framework that can jointly train a dynamics model and a factor graph estimator. Our approach leverages a Gram-Schmidt (GS) process to extract roto-translational invariant representations to improve the model performance, which can further reduce the validation error compared to data augmentation method. Additionally, we propose a network architecture that enhances nonlinearity by using self-multiplicative bypasses in the layer connections. By leveraging these novel methods, our proposed approach predicts the ball’s position with an RMSE of 37.2 mm of the paddle radius at the apex after the first bounce, and 71.5 mm after the second bounce.
arxiv情報
著者 | Qingyu Xiao,Zixuan Wu,Matthew Gombolay |
発行日 | 2025-02-20 21:24:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google