Learning control of underactuated double pendulum with Model-Based Reinforcement Learning

要約

このレポートでは、IROS 2024 で開催される第 2 回 AI オリンピック競技会向けに提案されたソリューションについて説明します。私たちのソリューションは、MC-PILCO という名前の最近のモデルベースの強化学習アルゴリズムに基づいています。
アルゴリズムを簡単にレビューするだけでなく、当面のタスクにおける MC-PILCO 実装の最も重要な側面についても説明します。

要約(オリジナル)

This report describes our proposed solution for the second AI Olympics competition held at IROS 2024. Our solution is based on a recent Model-Based Reinforcement Learning algorithm named MC-PILCO. Besides briefly reviewing the algorithm, we discuss the most critical aspects of the MC-PILCO implementation in the tasks at hand.

arxiv情報

著者 Niccolò Turcato,Alberto Dalla Libera,Giulio Giacomuzzo,Ruggero Carli,Diego Romeres
発行日 2024-09-09 17:17:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク