ADAM: An Embodied Causal Agent in Open-World Environments

要約

Minecraft のようなオープンワールド環境では、既存のエージェントは構造化された知識、特に因果関係を継続的に学習するという課題に直面しています。
これらの課題は、ブラック ボックス モデルに固有の不透明さと、トレーニング中の事前知識への過度の依存によって生じており、解釈可能性と一般化能力が損なわれています。
この目的を達成するために、Minecraft に組み込まれた因果エージェントである ADAM を導入します。ADAM は、オープンワールドを自律的に移動し、マルチモーダルなコンテキストを認識し、因果世界の知識を学習し、生涯学習を通じて複雑なタスクに取り組むことができます。
ADAM は、次の 4 つの主要なコンポーネントによって強化されています。1) 対話モジュール。対話プロセスを文書化しながらエージェントがアクションを実行できるようにします。
2) 因果モデルモジュール。拡大し続ける因果グラフをゼロから構築する任務を負い、解釈可能性を高め、事前知識への依存を軽減します。
3)コントローラモジュールは、プランナ、アクター、およびメモリプールを備え、学習された因果グラフを使用してタスクを達成する。
4) マルチモーダル大規模言語モデルを利用した認識モジュール。これにより、ADAM が人間のプレイヤーのように認識できるようになります。
広範な実験により、ADAM がほぼ完璧な因果グラフをゼロから構築し、強力な解釈可能性を備えた効率的なタスクの分解と実行が可能になることが示されています。
特に、事前知識が利用できない変更された Minecraft ゲームでも、ADAM はパフォーマンスを維持し、顕著な堅牢性と汎用化機能を示します。
ADAM は、因果関係の手法と身体化されたエージェントを相乗的な方法で統合する新しいパラダイムの先駆者です。
私たちのプロジェクト ページは https://opencausalab.github.io/ADAM にあります。

要約(オリジナル)

In open-world environments like Minecraft, existing agents face challenges in continuously learning structured knowledge, particularly causality. These challenges stem from the opacity inherent in black-box models and an excessive reliance on prior knowledge during training, which impair their interpretability and generalization capability. To this end, we introduce ADAM, An emboDied causal Agent in Minecraft, that can autonomously navigate the open world, perceive multimodal contexts, learn causal world knowledge, and tackle complex tasks through lifelong learning. ADAM is empowered by four key components: 1) an interaction module, enabling the agent to execute actions while documenting the interaction processes; 2) a causal model module, tasked with constructing an ever-growing causal graph from scratch, which enhances interpretability and diminishes reliance on prior knowledge; 3) a controller module, comprising a planner, an actor, and a memory pool, which uses the learned causal graph to accomplish tasks; 4) a perception module, powered by multimodal large language models, which enables ADAM to perceive like a human player. Extensive experiments show that ADAM constructs an almost perfect causal graph from scratch, enabling efficient task decomposition and execution with strong interpretability. Notably, in our modified Minecraft games where no prior knowledge is available, ADAM maintains its performance and shows remarkable robustness and generalization capability. ADAM pioneers a novel paradigm that integrates causal methods and embodied agents in a synergistic manner. Our project page is at https://opencausalab.github.io/ADAM.

arxiv情報

著者 Shu Yu,Chaochao Lu
発行日 2024-10-29 16:32:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV パーマリンク