Coordination and Machine Learning in Multi-Robot Systems: Applications in Robotic Soccer

要約

この論文では、人工知能、マルチエージェント システム、コーディネーション、インテリジェント ロボティクス、および深層強化学習の概念について説明します。
AI と DRL を効率的に使用して、サッカーの試合などの非常に複雑なアクションやタスクを実行できる効率的なロボット スキルと調整されたロボット チームを作成する方法に重点が置かれています。
また、ロボット サッカーの概念、ヒューマノイド シミュレーション 3D リーグとこの大会がもたらす新たな課題に重点を置いたロボカップ イニシアチブのビジョンと構造についても説明します。
この論文で提示される最終トピックは、FCPortugal プロジェクトの文脈で過去 22 年間にわたって著者が開発/調整した研究に基づいています。
この論文では、戦略、戦術、フォーメーション、セットプレイ、コーチング言語など、開発された調整方法論と、この概念の使用を最適化するための機械学習の使用について簡単に説明します。
提示されたトピックには、ブラック ボックス最適化のための新しい確率的検索アルゴリズムと、全方向歩行スキルの最適化におけるその使用、ロボットのマルチエージェント学習、および距離を制御されたヒューマノイド キックの作成も含まれます。
最後に、近接ポリシー最適化アルゴリズムのバリエーションと、ロボットとマルチロボットの学習のための高度なモデリングを使用した新しいアプリケーションについて、新しいヒューマノイドのダッシュとランニングのスキル、および驚くべきヒューマノイド ロボットのサッカー ドリブル スキルに重点を置いて簡単に説明します。
FCポルトガルのプロジェクトにより、私たちは100以上の論文を発表し、さまざまなリーグでのいくつかのコンテストとロボカップでの多くの科学賞を受賞することができました。
私たちのチームは、ロボカップ 2022 大会のシミュレーション 3D リーグで 84 ゴールを記録し、わずか 2 失点で快勝したことを含め、国際大会で合計 40 以上の賞を受賞しました。

要約(オリジナル)

This paper presents the concepts of Artificial Intelligence, Multi-Agent-Systems, Coordination, Intelligent Robotics and Deep Reinforcement Learning. Emphasis is given on and how AI and DRL, may be efficiently used to create efficient robot skills and coordinated robotic teams, capable of performing very complex actions and tasks, such as playing a game of soccer. The paper also presents the concept of robotic soccer and the vision and structure of the RoboCup initiative with emphasis on the Humanoid Simulation 3D league and the new challenges this competition, poses. The final topics presented at the paper are based on the research developed/coordinated by the author throughout the last 22 years in the context of the FCPortugal project. The paper presents a short description of the coordination methodologies developed, such as: Strategy, Tactics, Formations, Setplays, and Coaching Languages and the use of Machine Learning to optimize the use of this concepts. The topics presented also include novel stochastic search algorithms for black box optimization and their use in the optimization of omnidirectional walking skills, robotic multi-agent learning and the creation of a humanoid kick with controlled distance. Finally, new applications using variations of the Proximal Policy Optimization algorithm and advanced modelling for robot and multi-robot learning are briefly explained with emphasis for our new humanoid sprinting and running skills and an amazing humanoid robot soccer dribbling skill. FCPortugal project enabled us to publish more than 100 papers and win several competitions in different leagues and many scientific awards at RoboCup. In total, our team won more than 40 awards in international competitions including a clear victory at the Simulation 3D League at RoboCup 2022 competition, scoring 84 goals and conceding only 2.

arxiv情報

著者 Luis Paulo Reis
発行日 2023-12-26 14:48:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク