Applications of Large Scale Foundation Models for Autonomous Driving

要約

2004/05 年の DARPA グランド チャレンジ (地方) と 2007 年の都市チャレンジ以来、自動運転は AI アプリケーションの最も活発な分野となっています。
最近、大規模言語モデル (LLM) を活用した chatGPT や PaLM などのチャット システムが登場し、自然言語処理 (NLP) で汎用人工知能 (AGI) を実現するための有望な方向性として急速に普及しています。
これらの能力を自動運転の再構築に利用できるのではないかという自然な考え方が生まれます。
LLM を基礎モデルと組み合わせることで、人間の知識、常識、推論を利用して、現在のロングテールの AI ジレンマから自動運転システムを再構築することが可能になります。
この論文では、シミュレーション、ワールドモデル、データアノテーションとプランニング、または E2E ソリューションなどに分類され、自動運転に適用される基礎モデルと LLM の技術を調査します。

要約(オリジナル)

Since DARPA Grand Challenges (rural) in 2004/05 and Urban Challenges in 2007, autonomous driving has been the most active field of AI applications. Recently powered by large language models (LLMs), chat systems, such as chatGPT and PaLM, emerge and rapidly become a promising direction to achieve artificial general intelligence (AGI) in natural language processing (NLP). There comes a natural thinking that we could employ these abilities to reformulate autonomous driving. By combining LLM with foundation models, it is possible to utilize the human knowledge, commonsense and reasoning to rebuild autonomous driving systems from the current long-tailed AI dilemma. In this paper, we investigate the techniques of foundation models and LLMs applied for autonomous driving, categorized as simulation, world model, data annotation and planning or E2E solutions etc.

arxiv情報

著者 Yu Huang,Yue Chen,Zhu Li
発行日 2023-11-27 16:38:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク