ParkingE2E: Camera-based End-to-end Parking Network, from Images to Planning

要約

自動駐車は、インテリジェント運転分野において重要な課題です。
従来の駐車アルゴリズムは通常、ルールベースのスキームを使用して実装されます。
ただし、アルゴリズムの複雑な設計のため、これらの方法は複雑な駐車シナリオではあまり効果的ではありません。
対照的に、ニューラル ネットワーク ベースの方法は、ルール ベースの方法よりも直感的で多用途である傾向があります。
専門家の駐車軌跡データを多数収集し、学習ベースの方法で人間の戦略をエミュレートすることで、駐車タスクに効果的に対処できます。
この論文では、人間の運転軌跡を模倣することにより、RGB画像から経路計画までエンドツーエンドの計画を実行する模倣学習を採用しています。
提案されたエンドツーエンドのアプローチでは、ターゲット クエリ エンコーダを利用して画像とターゲットの特徴を融合し、トランスフォーマベースのデコーダを利用して将来のウェイポイントを自己回帰的に予測します。
私たちは現実世界のシナリオで広範な実験を実施し、その結果、提案された方法が現実世界の 4 つの異なるガレージで平均 87.8% の駐車成功率を達成したことが実証されました。
実車実験により、この論文で提案した方法の実現可能性と有効性がさらに検証されます。

要約(オリジナル)

Autonomous parking is a crucial task in the intelligent driving field. Traditional parking algorithms are usually implemented using rule-based schemes. However, these methods are less effective in complex parking scenarios due to the intricate design of the algorithms. In contrast, neural-network-based methods tend to be more intuitive and versatile than the rule-based methods. By collecting a large number of expert parking trajectory data and emulating human strategy via learning-based methods, the parking task can be effectively addressed. In this paper, we employ imitation learning to perform end-to-end planning from RGB images to path planning by imitating human driving trajectories. The proposed end-to-end approach utilizes a target query encoder to fuse images and target features, and a transformer-based decoder to autoregressively predict future waypoints. We conducted extensive experiments in real-world scenarios, and the results demonstrate that the proposed method achieved an average parking success rate of 87.8% across four different real-world garages. Real-vehicle experiments further validate the feasibility and effectiveness of the method proposed in this paper.

arxiv情報

著者 Changze Li,Ziheng Ji,Zhe Chen,Tong Qin,Ming Yang
発行日 2024-08-04 15:20:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク