LanguageMPC: Large Language Models as Decision Makers for Autonomous Driving

要約

既存の学習ベースの自律運転(AD)システムは、高レベルの情報を理解し、まれなイベントに一般化し、解釈可能性を提供する上で課題に直面しています。
これらの問題に対処するために、この作業は、人間の常識的理解を必要とする複雑な広告シナリオの意思決定コンポーネントとして、大規模な言語モデル(LLM)を採用しています。
認知経路を考案して、LLMを使用して包括的な推論を可能にし、LLMの決定を実用的な運転コマンドに変換するためのアルゴリズムを開発します。
このアプローチを通じて、LLMの決定は、ガイド付きパラメーターマトリックスの適応により、低レベルのコントローラーとシームレスに統合されます。
広範な実験は、提案された方法が、単一車両タスクのベースラインアプローチを一貫して上回るだけでなく、LLMSの常識的な推論能力のおかげで、複雑な運転行動をマルチベヒクル調整でも処理するのに役立つことを示しています。
このホワイトペーパーでは、LLMを、安全性、効率、一般化可能性、および相互運用性の観点から、複雑な広告シナリオの効果的な意思決定者として活用するための最初のステップを紹介します。
私たちは、この分野での将来の研究のインスピレーションとして機能することを目指しています。
プロジェクトページ:https://sites.google.com/view/llm-mpc

要約(オリジナル)

Existing learning-based autonomous driving (AD) systems face challenges in comprehending high-level information, generalizing to rare events, and providing interpretability. To address these problems, this work employs Large Language Models (LLMs) as a decision-making component for complex AD scenarios that require human commonsense understanding. We devise cognitive pathways to enable comprehensive reasoning with LLMs, and develop algorithms for translating LLM decisions into actionable driving commands. Through this approach, LLM decisions are seamlessly integrated with low-level controllers by guided parameter matrix adaptation. Extensive experiments demonstrate that our proposed method not only consistently surpasses baseline approaches in single-vehicle tasks, but also helps handle complex driving behaviors even multi-vehicle coordination, thanks to the commonsense reasoning capabilities of LLMs. This paper presents an initial step toward leveraging LLMs as effective decision-makers for intricate AD scenarios in terms of safety, efficiency, generalizability, and interoperability. We aspire for it to serve as inspiration for future research in this field. Project page: https://sites.google.com/view/llm-mpc

arxiv情報

著者 Hao Sha,Yao Mu,Yuxuan Jiang,Li Chen,Chenfeng Xu,Ping Luo,Shengbo Eben Li,Masayoshi Tomizuka,Wei Zhan,Mingyu Ding
発行日 2025-04-15 03:45:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO パーマリンク