Task-Oriented Koopman-Based Control with Contrastive Encoder

要約

エンドツーエンドの強化学習と対照エンコーダを利用して、反復ループ内でクープマン潜在埋め込み、演算子、および関連する線形コントローラーを同時に学習する、タスク指向のクープマン ベースの制御を紹介します。
コントローラー学習の主な目的としてタスク コストを優先することで、明確に特定されたモデルへのコントローラー設計の依存度が軽減されます。これにより、私たちの知る限り初めて、クープマン制御が低次元から高次元に拡張されます。
ピクセルベースのタスクやライダー観測を備えた実際のロボットなどの複雑な非線形システム。
コードとビデオは \href{https://sites.google.com/view/kpmlilattsupp/}{こちら} からご覧いただけます。

要約(オリジナル)

We present task-oriented Koopman-based control that utilizes end-to-end reinforcement learning and contrastive encoder to simultaneously learn the Koopman latent embedding, operator, and associated linear controller within an iterative loop. By prioritizing the task cost as the main objective for controller learning, we reduce the reliance of controller design on a well-identified model, which, for the first time to the best of our knowledge, extends Koopman control from low to high-dimensional, complex nonlinear systems, including pixel-based tasks and a real robot with lidar observations. Code and videos are available \href{https://sites.google.com/view/kpmlilatsupp/}{here}.

arxiv情報

著者 Xubo Lyu,Hanyang Hu,Seth Siriya,Ye Pu,Mo Chen
発行日 2023-11-01 05:13:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク