ManeuverGPT Agentic Control for Safe Autonomous Stunt Maneuvers

要約

自動運転車の次世代のアクティブな安全機能は、車両のハンドリングの限界で高能力の動きを達成するために、プロのスタントドライバーが実行したものと同様の回避的なハザード回避策を安全に実行できる必要があります。
このペーパーでは、コントローラーとして大規模な言語モデル(LLM)ベースのエージェントを使用して自動運転車で高ダイナミックスタント操作を生成および実行するための新しいフレームワークであるManeuvergptを紹介します。
Jターンなどの積極的な操作は、カーラシミュレーション環境内でターゲットをターゲットにし、モデルの重みを再調整せずにタブララサを開始するための反復的で迅速なアプローチを実証します。
3つの専門的なエージェント(1)ユーザーコマンドをコンテキスト化するためのクエリエンチャーエージェント、(2)操作パラメーターを生成するためのドライバーエージェント、および(3)物理学ベースと安全性の制約を強化するパラメーター有効化エージェントで構成されるエージェントアーキテクチャを提案します。
実験結果は、異なる車両のダイナミクスに適応するテキストプロンプトを介して、複数の車両モデル間でのJターン実行の成功を示しています。
確立された成功基準を介してパフォーマンスを評価し、数値の精度とシナリオの複雑さに関する制限を議論します。
私たちの調査結果は、言語ベースの推論とアルゴリズム検証を組み合わせたハイブリッドアプローチの重要性を強調しながら、LLM駆動型制御の柔軟で高陽性の操作の可能性を強調しています。

要約(オリジナル)

The next generation of active safety features in autonomous vehicles should be capable of safely executing evasive hazard-avoidance maneuvers akin to those performed by professional stunt drivers to achieve high-agility motion at the limits of vehicle handling. This paper presents a novel framework, ManeuverGPT, for generating and executing high-dynamic stunt maneuvers in autonomous vehicles using large language model (LLM)-based agents as controllers. We target aggressive maneuvers, such as J-turns, within the CARLA simulation environment and demonstrate an iterative, prompt-based approach to refine vehicle control parameters, starting tabula rasa without retraining model weights. We propose an agentic architecture comprised of three specialized agents (1) a Query Enricher Agent for contextualizing user commands, (2) a Driver Agent for generating maneuver parameters, and (3) a Parameter Validator Agent that enforces physics-based and safety constraints. Experimental results demonstrate successful J-turn execution across multiple vehicle models through textual prompts that adapt to differing vehicle dynamics. We evaluate performance via established success criteria and discuss limitations regarding numeric precision and scenario complexity. Our findings underscore the potential of LLM-driven control for flexible, high-dynamic maneuvers, while highlighting the importance of hybrid approaches that combine language-based reasoning with algorithmic validation.

arxiv情報

著者 Shawn Azdam,Pranav Doma,Aliasghar Moj Arab
発行日 2025-03-12 03:51:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY パーマリンク