FC Portugal 3D Simulation Team: Team Description Paper 2020

要約

FC Portugal 3D チームは、以前のシミュレーション リーグ 2D/3D チームと標準プラットフォーム リーグ チームの構造に基づいて開発されました。
ロボットの低レベルスキルに関する私たちの研究は、モデルベースのアプローチを使用して、最小限の適応で実際のロボットに適用できる動作の開発に焦点を当てています。
高レベルのサッカー調整方法論とチームプレーに関する私たちの研究は、主に、2D サッカーチームから 3D ヒューマノイド環境への以前に開発された方法論の適応と、以前に開発されたものに基づく新しい調整方法論の作成に焦点を当てています。
私たちのチームの研究志向の開発により、チームは長年にわたって最も競争力のあるチームの 1 つになりました (2000 年に世界チャンピオン、2002 年にコーチ チャンピオン、2000 年と 2001 年にヨーロッパ チャンピオン、2003 年と 2004 年にコーチ 2 位、ヨーロッパ チャンピオン)。
2006 年に Rescue Simulation と Simulation 3D で優勝、2006 年にブレーメンで Simulation 3D で世界チャンピオン、2007 年、2012 年、2013 年、2014 年、2015 年にヨーロッパ チャンピオン)。
このホワイト ペーパーでは、過去数年間の 3D シミュレーション リーグ チームの主なイノベーションについて説明します。
強化学習タスクの新しい汎用フレームワークも開発されました。
現在の研究は、ランニングやスプリントなどの低レベルのスキルを最適化するための新しい学習アルゴリズムを開発することにより、上記のフレームワークを改善することに焦点を当てています。
また、低レベルの実装の詳細を共有することなくシンプルなインターフェースを公開する新しいフレームワークを使用して完了する強化学習課題を提供することにより、学生の接触を増やそうとしています。

要約(オリジナル)

The FC Portugal 3D team is developed upon the structure of our previous Simulation league 2D/3D teams and our standard platform league team. Our research concerning the robot low-level skills is focused on developing behaviors that may be applied on real robots with minimal adaptation using model-based approaches. Our research on high-level soccer coordination methodologies and team playing is mainly focused on the adaptation of previously developed methodologies from our 2D soccer teams to the 3D humanoid environment and on creating new coordination methodologies based on the previously developed ones. The research-oriented development of our team has been pushing it to be one of the most competitive over the years (World champion in 2000 and Coach Champion in 2002, European champion in 2000 and 2001, Coach 2nd place in 2003 and 2004, European champion in Rescue Simulation and Simulation 3D in 2006, World Champion in Simulation 3D in Bremen 2006 and European champion in 2007, 2012, 2013, 2014 and 2015). This paper describes some of the main innovations of our 3D simulation league team during the last years. A new generic framework for reinforcement learning tasks has also been developed. The current research is focused on improving the above-mentioned framework by developing new learning algorithms to optimize low-level skills, such as running and sprinting. We are also trying to increase student contact by providing reinforcement learning assignments to be completed using our new framework, which exposes a simple interface without sharing low-level implementation details.

arxiv情報

著者 Nuno Lau,Luis Paulo Reis,David Simoes,Mohammadreza Kasaei. Miguel Abreu,Tiago Silva,Francisco Resende
発行日 2023-03-28 12:41:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク