Subgoal Search For Complex Reasoning Tasks

要約

人間は、あるアイデアから関連するアイデアに移動する精神的プロセスを通じて、複雑な推論課題を解くことに優れている。これにヒントを得て、我々はサブゴール・サーチ(kSubS)法を提案する。その主要な構成要素は、達成可能で解に近い多様なサブゴールを生成する、学習されたサブゴール生成器である。サブゴールを用いることで、探索空間を縮小し、効率的なプランニングに適した高レベルの探索グラフを生成する。本論文では、変換器ベースのサブゴールモジュールと古典的な最良優先探索フレームワークを組み合わせてkSubSを実装する。k$番目ステップ先サブゴールを生成する単純なアプローチが、3つの挑戦的な領域で驚くほど効率的であることを示す:2つの人気のあるパズルゲーム、倉庫番とルービックキューブ、不等式証明ベンチマークINT。

要約(オリジナル)

Humans excel in solving complex reasoning tasks through a mental process of moving from one idea to a related one. Inspired by this, we propose Subgoal Search (kSubS) method. Its key component is a learned subgoal generator that produces a diversity of subgoals that are both achievable and closer to the solution. Using subgoals reduces the search space and induces a high-level search graph suitable for efficient planning. In this paper, we implement kSubS using a transformer-based subgoal module coupled with the classical best-first search framework. We show that a simple approach of generating $k$-th step ahead subgoals is surprisingly efficient on three challenging domains: two popular puzzle games, Sokoban and the Rubik’s Cube, and an inequality proving benchmark INT. kSubS achieves strong results including state-of-the-art on INT within a modest computational budget.

arxiv情報

著者 Konrad Czechowski,Tomasz Odrzygóźdź,Marek Zbysiński,Michał Zawalski,Krzysztof Olejnik,Yuhuai Wu,Łukasz Kuciński,Piotr Miłoś
発行日 2024-04-03 15:35:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク