Efficient RL via Disentangled Environment and Agent Representations

要約

自分自身と環境との分離を認識しているエージェントは、この理解を活用して視覚入力の効果的な表現を形成できます。
我々は、エージェントの形状やマスクなど、多くの場合安価に入手できるエージェントの視覚的な知識を使用して、RL アルゴリズムのそのような構造化表現を学習するアプローチを提案します。
これは、単純な補助損失を使用して RL 対物レンズに組み込まれます。
私たちの手法である構造化環境エージェント表現が、5 つの異なるロボットにわたる 18 の異なる困難なビジュアル シミュレーション環境において、最先端のモデルフリー アプローチよりも優れたパフォーマンスを発揮することを示します。
ウェブサイト https://sear-rl.github.io/

要約(オリジナル)

Agents that are aware of the separation between themselves and their environments can leverage this understanding to form effective representations of visual input. We propose an approach for learning such structured representations for RL algorithms, using visual knowledge of the agent, such as its shape or mask, which is often inexpensive to obtain. This is incorporated into the RL objective using a simple auxiliary loss. We show that our method, Structured Environment-Agent Representations, outperforms state-of-the-art model-free approaches over 18 different challenging visual simulation environments spanning 5 different robots. Website at https://sear-rl.github.io/

arxiv情報

著者 Kevin Gmelin,Shikhar Bahl,Russell Mendonca,Deepak Pathak
発行日 2023-09-05 17:59:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.NE, cs.RO パーマリンク