要約
パス計画は、自律的なドローン操作における重要なコンポーネントであり、複雑な環境を安全かつ効率的にナビゲーションを可能にします。
基礎モデル、特に大規模な言語モデル(LLMS)およびビジョン言語モデル(VLM)の最近の進歩は、ロボット工学における認識とインテリジェントな意思決定のための新しい機会を開きました。
ただし、グローバルパス計画における実用的な適用性と有効性は比較的未開拓のままです。
このペーパーでは、Foundation Model Guided Path Planners(FM-Planner)を提案し、ドローンパス計画のための包括的なベンチマーク研究と実用的な検証を提示します。
具体的には、最初に、標準化されたシミュレーションシナリオを使用して、8つの代表的なLLMおよびVLMアプローチを体系的に評価します。
効果的なリアルタイムナビゲーションを有効にするために、セマンティックな推論と視覚的知覚を組み合わせた統合されたLLM-Visionプランナーを設計します。
さらに、複数の構成の下での実際の実験を通じて、提案されたパスプランナーを展開および検証します。
私たちの調査結果は、実際のドローンアプリケーションに基礎モデルを展開し、自律飛行で実用的な実装を提供することの強み、制限、および実現可能性に関する貴重な洞察を提供します。
プロジェクトサイト:https://github.com/ntu-icg/fm-planner。
要約(オリジナル)
Path planning is a critical component in autonomous drone operations, enabling safe and efficient navigation through complex environments. Recent advances in foundation models, particularly large language models (LLMs) and vision-language models (VLMs), have opened new opportunities for enhanced perception and intelligent decision-making in robotics. However, their practical applicability and effectiveness in global path planning remain relatively unexplored. This paper proposes foundation model-guided path planners (FM-Planner) and presents a comprehensive benchmarking study and practical validation for drone path planning. Specifically, we first systematically evaluate eight representative LLM and VLM approaches using standardized simulation scenarios. To enable effective real-time navigation, we then design an integrated LLM-Vision planner that combines semantic reasoning with visual perception. Furthermore, we deploy and validate the proposed path planner through real-world experiments under multiple configurations. Our findings provide valuable insights into the strengths, limitations, and feasibility of deploying foundation models in real-world drone applications and providing practical implementations in autonomous flight. Project site: https://github.com/NTU-ICG/FM-Planner.
arxiv情報
著者 | Jiaping Xiao,Cheng Wen Tsao,Yuhang Zhang,Mir Feroskhan |
発行日 | 2025-05-27 06:41:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google