ParkingE2E: Camera-based End-to-end Parking Network, from Images to Planning


対照的に、ニューラル ネットワーク ベースの方法は、ルール ベースの方法よりも直感的で多用途である傾向があります。
提案されたエンドツーエンドのアプローチでは、ターゲット クエリ エンコーダを利用して画像とターゲットの特徴を融合し、トランスフォーマベースのデコーダを利用して将来のウェイポイントを自己回帰的に予測します。
私たちは現実世界のシナリオで広範な実験を実施し、その結果、提案された方法が現実世界の 4 つの異なるガレージで平均 87.8% の駐車成功率を達成したことが実証されました。


Autonomous parking is a crucial task in the intelligent driving field. Traditional parking algorithms are usually implemented using rule-based schemes. However, these methods are less effective in complex parking scenarios due to the intricate design of the algorithms. In contrast, neural-network-based methods tend to be more intuitive and versatile than the rule-based methods. By collecting a large number of expert parking trajectory data and emulating human strategy via learning-based methods, the parking task can be effectively addressed. In this paper, we employ imitation learning to perform end-to-end planning from RGB images to path planning by imitating human driving trajectories. The proposed end-to-end approach utilizes a target query encoder to fuse images and target features, and a transformer-based decoder to autoregressively predict future waypoints. We conducted extensive experiments in real-world scenarios, and the results demonstrate that the proposed method achieved an average parking success rate of 87.8% across four different real-world garages. Real-vehicle experiments further validate the feasibility and effectiveness of the method proposed in this paper.


著者 Changze Li,Ziheng Ji,Zhe Chen,Tong Qin,Ming Yang
発行日 2024-08-04 15:20:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク