要約
オブジェクトの再配置は、具現化されたエージェントにとって課題です。これらのタスクを解決するには、エンティティとその場所の構成の組み合わせ的に大きなセット全体で一般化する必要があるためです。
さらに悪いことに、これらのエンティティの表現は不明であり、感覚的知覚から推測する必要があります。
これらの根底にあるエンティティを明らかにし、構造化されていない視覚的入力から組み合わせた一般化を達成するための階層的抽象化アプローチを提示します。
ピクセルから推測されたエンティティ表現のクラスター上で因数分解された遷移グラフを構築することにより、エージェントのモデル内のエンティティの状態への介入と環境内のオブジェクトへの作用との間の対応を学習する方法を示します。
この対応を使用して、オブジェクトのさまざまな数と構成に一般化する制御方法を開発します。これは、シミュレートされた再配置タスクで評価した場合、現在のオフラインのディープ RL メソッドよりも優れています。
要約(オリジナル)
Object rearrangement is a challenge for embodied agents because solving these tasks requires generalizing across a combinatorially large set of configurations of entities and their locations. Worse, the representations of these entities are unknown and must be inferred from sensory percepts. We present a hierarchical abstraction approach to uncover these underlying entities and achieve combinatorial generalization from unstructured visual inputs. By constructing a factorized transition graph over clusters of entity representations inferred from pixels, we show how to learn a correspondence between intervening on states of entities in the agent’s model and acting on objects in the environment. We use this correspondence to develop a method for control that generalizes to different numbers and configurations of objects, which outperforms current offline deep RL methods when evaluated on simulated rearrangement tasks.
arxiv情報
著者 | Michael Chang,Alyssa L. Dayan,Franziska Meier,Thomas L. Griffiths,Sergey Levine,Amy Zhang |
発行日 | 2023-03-20 18:19:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google