BeSimulator: A Large Language Model Powered Text-based Behavior Simulator

要約

従来のロボット シミュレータは、物理プロセス モデリングとリアルなレンダリングに焦点を当てており、多くの場合、高い計算コスト、非効率性、適応性の制限に悩まされていました。
この問題に対処するために、ロボットの動作ロジックをチェックし、ロボットの動作の結果と実際のシナリオとの間の十分な整合を達成することに重点を置く、ロボット工学における動作シミュレーションを提案します。
このペーパーでは、テキストベースの環境における動作シミュレーションの試みとして、LLM を利用した新しいモジュール式フレームワークである BeSimulator を紹介します。
テキストベースの仮想環境を構築し、セマンティックレベルのシミュレーションを実行することにより、BeSimulator はシナリオ全体を一般化し、長期にわたる複雑なシミュレーションを実現できます。
人間の認知プロセスにインスピレーションを得たもので、動作の実行可能性と状態遷移の分析に優れた、行動連鎖シミュレーションと呼ばれる「検討、決定、キャプチャ、転送」方法論を採用しています。
さらに、BeSimulator にはコード駆動型の推論が組み込まれており、算術演算を可能にして信頼性を向上させるとともに、シミュレーションを改良するための反射フィードバックを統合します。
手動で構築したビヘイビア ツリー ベースのシミュレーション ベンチマーク BTSIMBENCH に基づく実験では、ベースラインと比較してビヘイビア シミュレーションのパフォーマンスが 14.7% から 26.6% の大幅な向上を示しています。

要約(オリジナル)

Traditional robot simulators focus on physical process modeling and realistic rendering, often suffering from high computational costs, inefficiencies, and limited adaptability. To handle this issue, we propose Behavior Simulation in robotics to emphasize checking the behavior logic of robots and achieving sufficient alignment between the outcome of robot actions and real scenarios. In this paper, we introduce BeSimulator, a modular and novel LLM-powered framework, as an attempt towards behavior simulation in the context of text-based environments. By constructing text-based virtual environments and performing semantic-level simulation, BeSimulator can generalize across scenarios and achieve long-horizon complex simulation. Inspired by human cognition processes, it employs a ‘consider-decide-capture-transfer’ methodology, termed Chain of Behavior Simulation, which excels at analyzing action feasibility and state transitions. Additionally, BeSimulator incorporates code-driven reasoning to enable arithmetic operations and enhance reliability, as well as integrates reflective feedback to refine simulation. Based on our manually constructed behavior-tree-based simulation benchmark BTSIMBENCH, our experiments show a significant performance improvement in behavior simulation compared to baselines, ranging from 14.7% to 26.6%.

arxiv情報

著者 Jianan Wang,Bin Li,Xueying Wang,Fu Li,Yunlong Wu,Juan Chen,Xiaodong Yi
発行日 2024-09-24 08:37:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.RO パーマリンク