要約
古典的な象徴的な計画を変圧器ベースのポリシーと結びつけて、複雑で長期の意思決定タスクに対処する階層的な神経腫瘍制御フレームワークを提示します。
高レベルでは、シンボリックプランナーは、論理的命題に基づいて解釈可能なオペレーターのシーケンスを構築し、グローバルな制約と目標を体系的に順守します。
低レベルでは、各シンボリック演算子は、不確実で高次元の環境できめの細かい一連のアクションを生成するための決定変圧器を条件として、サブゴールトークンに翻訳されます。
シンボリックプランナーと神経実行層の両方からの近似誤差がどのように蓄積するかを示す理論分析を提供します。
複数のキー、ロックされたドア、アイテム収集タスクを備えたグリッドワールドの経験的評価は、階層的アプローチが成功率と政策効率における純粋にエンドツーエンドの神経アプローチよりも優れていることを示しています。
要約(オリジナル)
We present a hierarchical neuro-symbolic control framework that couples classical symbolic planning with transformer-based policies to address complex, long-horizon decision-making tasks. At the high level, a symbolic planner constructs an interpretable sequence of operators based on logical propositions, ensuring systematic adherence to global constraints and goals. At the low level, each symbolic operator is translated into a sub-goal token that conditions a decision transformer to generate a fine-grained sequence of actions in uncertain, high-dimensional environments. We provide theoretical analysis showing how approximation errors from both the symbolic planner and the neural execution layer accumulate. Empirical evaluations in grid-worlds with multiple keys, locked doors, and item-collection tasks show that our hierarchical approach outperforms purely end-to-end neural approach in success rates and policy efficiency.
arxiv情報
著者 | Ali Baheri,Cecilia O. Alm |
発行日 | 2025-03-12 15:02:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google