Stimulate the Potential of Robots via Competition

要約

競争環境では、他の個人や対戦相手と比較して成功したいという願望からプレッシャーを感じることがよくあります。
私たちはプレッシャーの下で不安になるかもしれませんが、他の人たちに遅れないようにするために、自分の可能性を最大限に刺激する原動力になることもあります。
これにインスピレーションを得て、私たちは、個々のロボットが競争から知識を獲得し、レースでのダイナミクスの可能性を最大限に刺激できるようにする競争学習フレームワークを提案します。
具体的には、競争者間の競争情報が、有利な行動を学習するための追加の補助信号として導入されます。
さらに、マルチエージェント レース環境を構築し、広範な実験が行われ、競争環境で訓練されたロボットが、単一ロボット環境で SoTA アルゴリズムで訓練されたロボットよりも優れたパフォーマンスを発揮することが実証されました。

要約(オリジナル)

It is common for us to feel pressure in a competition environment, which arises from the desire to obtain success comparing with other individuals or opponents. Although we might get anxious under the pressure, it could also be a drive for us to stimulate our potentials to the best in order to keep up with others. Inspired by this, we propose a competitive learning framework which is able to help individual robot to acquire knowledge from the competition, fully stimulating its dynamics potential in the race. Specifically, the competition information among competitors is introduced as the additional auxiliary signal to learn advantaged actions. We further build a Multiagent-Race environment, and extensive experiments are conducted, demonstrating that robots trained in competitive environments outperform ones that are trained with SoTA algorithms in single robot environment.

arxiv情報

著者 Kangyao Huang,Di Guo,Xinyu Zhang,Xiangyang Ji,Huaping Liu
発行日 2024-03-15 17:21:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク