HBTP: Heuristic Behavior Tree Planning with Large Language Model Reasoning

要約

動作ツリー(BTS)は、モジュール性、反応性、堅牢性により、ロボット工学の一般的な制御構造になりつつあります。
BT生成方法に関しては、BT計画は信頼できるBTを生成することを約束しています。
ただし、BT計画のスケーラビリティは、主にドメインの知識の不足による複雑なシナリオでの長期にわたる計画時間によって制約されることがよくあります。
対照的に、事前に訓練された大規模な言語モデル(LLM)は、さまざまなドメインにわたってタスク推論機能を実証していますが、計画の正確性と安全性は不確実なままです。
このペーパーでは、BT計画をLLMの推論と統合し、BT世代の信頼できる効率的なフレームワークであるヒューリスティックな行動ツリープランニング(HBTP)を導入することを提案しています。
HBTPの重要なアイデアは、タスク固有の推論のためにLLMSを活用してヒューリスティックパスを生成することです。BT計画は、効率的に拡大するために従うことができます。
まず、ヒューリスティックBT拡張プロセスを紹介し、それぞれ最適な計画と満足の計画のために設計された2つのヒューリスティックバリアントを紹介します。
次に、推論の正確性と計画効率の両方をさらに強化するために、アクションスペースの剪定や反射フィードバックを含むLLM推論の不正確さに対処する方法を提案します。
実験はHBTPの理論的境界を示し、4つのデータセットからの結果は、日常のサービスロボットアプリケーションにおける実際の有効性を確認します。

要約(オリジナル)

Behavior Trees (BTs) are increasingly becoming a popular control structure in robotics due to their modularity, reactivity, and robustness. In terms of BT generation methods, BT planning shows promise for generating reliable BTs. However, the scalability of BT planning is often constrained by prolonged planning times in complex scenarios, largely due to a lack of domain knowledge. In contrast, pre-trained Large Language Models (LLMs) have demonstrated task reasoning capabilities across various domains, though the correctness and safety of their planning remain uncertain. This paper proposes integrating BT planning with LLM reasoning, introducing Heuristic Behavior Tree Planning (HBTP)-a reliable and efficient framework for BT generation. The key idea in HBTP is to leverage LLMs for task-specific reasoning to generate a heuristic path, which BT planning can then follow to expand efficiently. We first introduce the heuristic BT expansion process, along with two heuristic variants designed for optimal planning and satisficing planning, respectively. Then, we propose methods to address the inaccuracies of LLM reasoning, including action space pruning and reflective feedback, to further enhance both reasoning accuracy and planning efficiency. Experiments demonstrate the theoretical bounds of HBTP, and results from four datasets confirm its practical effectiveness in everyday service robot applications.

arxiv情報

著者 Yishuai Cai,Xinglin Chen,Yunxin Mao,Minglong Li,Shaowu Yang,Wenjing Yang,Ji Wang
発行日 2025-03-07 08:27:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク