Multi-task UNet architecture for end-to-end autonomous driving

要約

我々は、フロントカメラからこのモデルを介して運転決定に至るまでのデータフローのパイプラインに、マルチタスクUNet(MTUNet)アーキテクチャと制御アルゴリズムを統合するエンドツーエンドの運転モデル​​を提案します。
これは、エンドツーエンドの駆動システムの総合的、動的、リアルタイムのパフォーマンス、ひいては MTUNet の安全性と解釈可能性を評価するための定量的な尺度を提供します。
このアーキテクチャは、車線セグメンテーション、経路予測、および車両制御のための 1 つのセグメンテーション、1 つの回帰、および 2 つの分類タスクで構成されます。
複雑さの異なる 3 つのアーキテクチャのバリアントを提示し、単一タスクと複数タスクの両方について 4 つの静的尺度で異なるタスクでそれらを比較し、リアルタイム シミュレーションで 2 つの追加の動的尺度によって最適な 1 つを特定します。
私たちの結果は、提案された教師あり学習モデルのパフォーマンスが、エンドツーエンドではなくマルチモジュールである同じタスクの曲がりくねった道路における強化学習モデルのパフォーマンスに匹敵することを示しています。

要約(オリジナル)

We propose an end-to-end driving model that integrates a multi-task UNet (MTUNet) architecture and control algorithms in a pipeline of data flow from a front camera through this model to driving decisions. It provides quantitative measures to evaluate the holistic, dynamic, and real-time performance of end-to-end driving systems and thus the safety and interpretability of MTUNet. The architecture consists of one segmentation, one regression, and two classification tasks for lane segmentation, path prediction, and vehicle controls. We present three variants of the architecture having different complexities, compare them on different tasks in four static measures for both single and multiple tasks, and then identify the best one by two additional dynamic measures in real-time simulation. Our results show that the performance of the proposed supervised learning model is comparable to that of a reinforcement learning model on curvy roads for the same task, which is not end-to-end but multi-module.

arxiv情報

著者 Der-Hau Lee,Jinn-Liang Liu
発行日 2023-09-08 07:19:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク