Traffic Regulation-aware Path Planning with Regulation Databases and Vision-Language Models

要約

このペーパーでは、自動化された運転システム(ADS)にトラフィック規制のコンプライアンスを統合するフレームワークを紹介およびテストします。
このフレームワークにより、広告は交通法に従い、運転環境に基づいて情報に基づいた決定を下すことができます。
RGBカメラ入力とビジョン言語モデル(VLM)を使用して、システムは記述テキストを生成して、規制を意識する意思決定プロセスをサポートし、法的および安全な運転慣行を確保します。
この情報は、マシン読み取り可能な広告レギュレーションデータベースと組み合わせて、法的制約内の将来の運転計画を導きます。
主な機能には、1)レギュレーションデータベースの意思決定をサポートする規制データベース、2)レギュレーション対応パス計画のためのセンサー入力を使用した自動プロセス、および3)シミュレーション環境と実際の環境の両方での検証。
特に、実際の車両テストは、フレームワークのパフォーマンスを評価するだけでなく、検出、推論、および計画を統合することにより、複雑な運転問題を解決するVLMの潜在的と課題と課題を評価します。
この作業は、広告に対する合法性、安全性、および一般の信頼を高め、現場での重要な前進を表します。

要約(オリジナル)

This paper introduces and tests a framework integrating traffic regulation compliance into automated driving systems (ADS). The framework enables ADS to follow traffic laws and make informed decisions based on the driving environment. Using RGB camera inputs and a vision-language model (VLM), the system generates descriptive text to support a regulation-aware decision-making process, ensuring legal and safe driving practices. This information is combined with a machine-readable ADS regulation database to guide future driving plans within legal constraints. Key features include: 1) a regulation database supporting ADS decision-making, 2) an automated process using sensor input for regulation-aware path planning, and 3) validation in both simulated and real-world environments. Particularly, the real-world vehicle tests not only assess the framework’s performance but also evaluate the potential and challenges of VLMs to solve complex driving problems by integrating detection, reasoning, and planning. This work enhances the legality, safety, and public trust in ADS, representing a significant step forward in the field.

arxiv情報

著者 Xu Han,Zhiwen Wu,Xin Xia,Jiaqi Ma
発行日 2025-03-12 03:21:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.IV, eess.SY パーマリンク