要約
家庭環境や産業環境で人間の指示に従ってタスクを実行するロボットには、基本的に適応性と信頼性の両方が必要です。
ビヘイビア ツリー (BT) は、そのモジュール性と反応性により、これらのシナリオに適切な制御アーキテクチャとして浮上します。
しかし、既存の BT 生成方法は、自然言語の解釈を含まないか、理論的に BT の成功を保証できません。
この論文では、BT 生成のための 2 段階のフレームワークを提案します。このフレームワークでは、まず大規模言語モデル (LLM) を使用して高レベルの命令から目標を解釈し、次に最適動作ツリー拡張アルゴリズム (OBTEA) を通じて効率的な目標固有の BT を構築します。
私たちは目標を一次ロジックの整った式として表現し、意図の理解と最適な行動計画を効果的に橋渡しします。
サービス ロボットの実験では、文法的に正しく、正確に解釈された目標を生成する LLM の習熟度を検証し、さまざまな指標でベースライン BT 拡張アルゴリズムに対する OBTEA の優位性を実証し、最終的にフレームワークの実用的な展開可能性を確認します。
プロジェクトの Web サイトは https://dids-ei.github.io/Project/LLM-OBTEA/ です。
要約(オリジナル)
Robots executing tasks following human instructions in domestic or industrial environments essentially require both adaptability and reliability. Behavior Tree (BT) emerges as an appropriate control architecture for these scenarios due to its modularity and reactivity. Existing BT generation methods, however, either do not involve interpreting natural language or cannot theoretically guarantee the BTs’ success. This paper proposes a two-stage framework for BT generation, which first employs large language models (LLMs) to interpret goals from high-level instructions, then constructs an efficient goal-specific BT through the Optimal Behavior Tree Expansion Algorithm (OBTEA). We represent goals as well-formed formulas in first-order logic, effectively bridging intent understanding and optimal behavior planning. Experiments in the service robot validate the proficiency of LLMs in producing grammatically correct and accurately interpreted goals, demonstrate OBTEA’s superiority over the baseline BT Expansion algorithm in various metrics, and finally confirm the practical deployability of our framework. The project website is https://dids-ei.github.io/Project/LLM-OBTEA/.
arxiv情報
著者 | Xinglin Chen,Yishuai Cai,Yunxin Mao,Minglong Li,Wenjing Yang,Weixia Xu,Ji Wang |
発行日 | 2024-06-27 13:17:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google