要約
ロボット向けカメラのみを使用して、ロボットシステムの「ピクセルからトルク」制御のための単純なオブザーバーベースの線形フィードバックポリシーの有効性を実証します。
具体的には、「生徒」出力フィードバックポリシーの画像ベースのLuenbergerオブザーバー(線形状態推定器)のマトリックスは、単純な線形寿命を介して「教師」の国家フィードバックポリシーが提供するデモデータから学ぶことができることを示しています。
正方形回帰。
結果として得られる線形出力フィードバックコントローラーは、高次元の生の画像からトルクに直接マップし、線形システム理論からのリッチな分析ツールに適しているため、学習問題に閉ループの安定性の制約を強制することができます。
また、Koopman Embeddingを介してメソッドの非線形拡張を調査します。
最後に、シミュレーションと実際のハードウェアの両方で、カートポールシステムの線形ピクセルからトルクへのポリシーの驚くべき有効性を実証します。
このポリシーは、モデルの不一致、プロセスとセンサーのノイズ、摂動、および閉塞の対象となる間、カメラフィードバックのみを使用して、安定化とスイングアップの軌跡追跡タスクの両方を正常に実行します。
すべての実験のオープンソースコードは、https://roboticexplorationlab.org/projects/linear_pixels_to_torques.htmlにあります。
要約(オリジナル)
We demonstrate the effectiveness of simple observer-based linear feedback policies for ‘pixels-to-torques’ control of robotic systems using only a robot-facing camera. Specifically, we show that the matrices of an image-based Luenberger observer (linear state estimator) for a ‘student’ output-feedback policy can be learned from demonstration data provided by a ‘teacher’ state-feedback policy via simple linear-least-squares regression. The resulting linear output-feedback controller maps directly from high-dimensional raw images to torques while being amenable to the rich set of analytical tools from linear systems theory, allowing us to enforce closed-loop stability constraints in the learning problem. We also investigate a nonlinear extension of the method via the Koopman embedding. Finally, we demonstrate the surprising effectiveness of linear pixels-to-torques policies on a cartpole system, both in simulation and on real hardware. The policy successfully executes both stabilizing and swing-up trajectory-tracking tasks using only camera feedback while subject to model mismatch, process and sensor noise, perturbations, and occlusions. Open-source code for all experiments can be found here: https://roboticexplorationlab.org/projects/linear_pixels_to_torques.html
arxiv情報
著者 | Jeong Hun Lee,Sam Schoedel,Aditya Bhardwaj,Zachary Manchester |
発行日 | 2024-12-10 18:09:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google