FlowPlan: Zero-Shot Task Planning with LLM Flow Engineering for Robotic Instruction Following

要約

タスクに続くロボット命令では、視覚認識、タスク計画、ターゲットのローカリゼーション、およびモーション実行のシームレスな統合が必要です。
ただし、既存のタスク計画のフォローするための既存のタスク計画方法は、運用上の制約の下で実用的な計画に長い指示を接地するのが難しいため、ゼロショットシナリオのデータ駆動型またはパフォーマンスのいずれかです。
これに対処するために、ゼロショットパイプラインを高め、ゼロショットとデータ駆動型のコンテキスト学習方法のパフォーマンスギャップを橋渡しする構造化されたマルチステージLLMワークフローであるFlowPlanを提案します。
計画プロセスをモジュラーステージに分解することにより、情報検索、言語レベルの推論、シンボリックレベルの計画、および論理評価 – フロープランは、正確なインスタンスレベルのターゲットローカライズのための運用上の制約を順守し、コンテキストガイダンスをさらに抽出しながら、論理的に一貫したアクションシーケンスを生成します。
Alfredに基づいて実世界のアプリケーションで検証されたこの方法は、データ駆動型のコンテキスト学習方法と比較して競争力のあるパフォーマンスを達成し、多様な環境で適応性を実証します。
この作業は、ラベル付きデータに依存せずにロボットシステムでゼロショットタスク計画を進めます。
プロジェクトWebサイト:https://instruction-following-project.github.io/。

要約(オリジナル)

Robotic instruction following tasks require seamless integration of visual perception, task planning, target localization, and motion execution. However, existing task planning methods for instruction following are either data-driven or underperform in zero-shot scenarios due to difficulties in grounding lengthy instructions into actionable plans under operational constraints. To address this, we propose FlowPlan, a structured multi-stage LLM workflow that elevates zero-shot pipeline and bridges the performance gap between zero-shot and data-driven in-context learning methods. By decomposing the planning process into modular stages–task information retrieval, language-level reasoning, symbolic-level planning, and logical evaluation–FlowPlan generates logically coherent action sequences while adhering to operational constraints and further extracts contextual guidance for precise instance-level target localization. Benchmarked on the ALFRED and validated in real-world applications, our method achieves competitive performance relative to data-driven in-context learning methods and demonstrates adaptability across diverse environments. This work advances zero-shot task planning in robotic systems without reliance on labeled data. Project website: https://instruction-following-project.github.io/.

arxiv情報

著者 Zijun Lin,Chao Tang,Hanjing Ye,Hong Zhang
発行日 2025-03-04 15:14:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク