Behavioral Cloning via Search in Video PreTraining Latent Space

要約

タイトル: ビデオプリトレーニングの潜在空間での探索による行動複製

要約:
– Minecraftのような環境でタスクを解決できる自律エージェントを構築することを目的としている
– ビデオプリトレーニングのモデルの潜在表現において、BASALT MineRLデータセットの近接探索を行うことで、制御問題を導入する
– エージェントは、選択された専門家の軌跡と状態表現の距離が発散しない限り、専門家の軌跡からアクションをコピーする
– 近接探索を繰り返して、有意義な示範軌跡を効果的に回復し、Minecraft環境で人間らしい行動を示すことができる

要約(オリジナル)

Our aim is to build autonomous agents that can solve tasks in environments like Minecraft. To do so, we used an imitation learning-based approach. We formulate our control problem as a search problem over a dataset of experts’ demonstrations, where the agent copies actions from a similar demonstration trajectory of image-action pairs. We perform a proximity search over the BASALT MineRL-dataset in the latent representation of a Video PreTraining model. The agent copies the actions from the expert trajectory as long as the distance between the state representations of the agent and the selected expert trajectory from the dataset do not diverge. Then the proximity search is repeated. Our approach can effectively recover meaningful demonstration trajectories and show human-like behavior of an agent in the Minecraft environment.

arxiv情報

著者 Federico Malato,Florian Leopold,Amogh Raut,Ville Hautamäki,Andrew Melnik
発行日 2023-04-17 05:38:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク