BarlowRL: Barlow Twins for Data-Efficient Reinforcement Learning


この論文では、Barlow Twins 自己教師あり学習フレームワークと DER (Data-Efficient Rainbow) アルゴリズムを組み合わせた、データ効率の高い強化学習エージェントである BarlowRL を紹介します。
BarlowRL は、Atari 100k ベンチマークで DER とその対照的な対応物である CURL の両方を上回っています。
BarlowRL は、空間全体に情報を強制的に分散させることで次元の崩壊を回避します。
これは、RL アルゴリズムが均一に分散された状態表現を利用するのに役立ち、最終的には優れたパフォーマンスをもたらします。
Barlow Twins と DER の統合により、データ効率が向上し、RL タスクで優れたパフォーマンスが達成されます。
BarlowRL は、RL アルゴリズムを改善するために自己教師あり学習手法を組み込む可能性を示しています。


This paper introduces BarlowRL, a data-efficient reinforcement learning agent that combines the Barlow Twins self-supervised learning framework with DER (Data-Efficient Rainbow) algorithm. BarlowRL outperforms both DER and its contrastive counterpart CURL on the Atari 100k benchmark. BarlowRL avoids dimensional collapse by enforcing information spread to the whole space. This helps RL algorithms to utilize uniformly spread state representation that eventually results in a remarkable performance. The integration of Barlow Twins with DER enhances data efficiency and achieves superior performance in the RL tasks. BarlowRL demonstrates the potential of incorporating self-supervised learning techniques to improve RL algorithms.


著者 Omer Veysel Cagatan
発行日 2023-08-08 13:59:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク