STMA: A Spatio-Temporal Memory Agent for Long-Horizon Embodied Task Planning

要約

具体化されたインテリジェンスの重要な目的は、エージェントが堅牢な意思決定と適応性を維持しながら、動的環境で長老のタスクを実行できるようにすることです。
この目標を達成するために、時空間メモリを統合することによりタスクの計画と実行を強化するために設計された新しいフレームワークであるSpatio-temporal Memory Agent(STMA)を提案します。
STMAは、3つの重要なコンポーネントに基づいて構築されています。(1)リアルタイムで歴史的および環境的変化をキャプチャする時空間的メモリモジュール、(2)適応的な空間的推論を促進する動的な知識グラフ、および(3)
タスク戦略を繰り返し洗練します。
さまざまなレベルの複雑さの下でのマルチステップ計画と探索を含む、32のタスクでTextWorld環境のSTMAを評価します。
実験結果は、STMAが成功率を31.25%改善し、最先端のモデルと比較して平均スコアが24.7%増加することを示しています。
結果は、具体化されたエージェントのメモリ能力を進める際の時空間記憶の有効性を強調しています。

要約(オリジナル)

A key objective of embodied intelligence is enabling agents to perform long-horizon tasks in dynamic environments while maintaining robust decision-making and adaptability. To achieve this goal, we propose the Spatio-Temporal Memory Agent (STMA), a novel framework designed to enhance task planning and execution by integrating spatio-temporal memory. STMA is built upon three critical components: (1) a spatio-temporal memory module that captures historical and environmental changes in real time, (2) a dynamic knowledge graph that facilitates adaptive spatial reasoning, and (3) a planner-critic mechanism that iteratively refines task strategies. We evaluate STMA in the TextWorld environment on 32 tasks, involving multi-step planning and exploration under varying levels of complexity. Experimental results demonstrate that STMA achieves a 31.25% improvement in success rate and a 24.7% increase in average score compared to the state-of-the-art model. The results highlight the effectiveness of spatio-temporal memory in advancing the memory capabilities of embodied agents.

arxiv情報

著者 Mingcong Lei,Yiming Zhao,Ge Wang,Zhixin Mai,Shuguang Cui,Yatong Han,Jinke Ren
発行日 2025-02-14 14:12:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク