Exploring Attention GAN for Vehicle Motion Prediction

要約

安全で信頼性の高い自動運転スタック (ADS) の設計は、この時代の最も困難なタスクの 1 つです。
これらの ADS は、完全な自律性と人間よりも優れた信頼性を備えた非常に動的な環境で駆動されることが期待されています。
その意味で、任意の複雑な交通シナリオを効率的かつ安全にナビゲートするには、ADS は周囲のアクターの将来の軌道を予測する機能を備えている必要があります。
現在の最先端のモデルは通常、リカレント、グラフ、および畳み込みネットワークに基づいており、車両予測のコンテキストで顕著な結果を達成しています。
この論文では、動き予測の生成モデルにおける注意の影響を調査し、物理的および社会的コンテキストの両方を考慮して、最も妥当な軌跡を計算します。
最初に、LSTM ネットワークを使用して過去の軌跡をエンコードします。これは、社会的コンテキストを計算する Multi-Head Self-Attention モジュールへの入力として機能します。
一方、加重補間を定式化して、最後の観測フレームの速度と方向を計算し、物理的コンテキストを表す HDMap 情報の駆動可能なものから抽出された許容可能なターゲット ポイントを計算します。
最後に、ジェネレーターの入力は多変量正規分布からサンプリングされたホワイト ノイズ ベクトルであり、社会的および物理的コンテキストがその条件であり、もっともらしい軌跡を予測します。
Argoverse Motion Forecasting Benchmark 1.1 を使用してこの方法を検証し、競争力のある単一モードの結果を達成しました。

要約(オリジナル)

The design of a safe and reliable Autonomous Driving stack (ADS) is one of the most challenging tasks of our era. These ADS are expected to be driven in highly dynamic environments with full autonomy, and a reliability greater than human beings. In that sense, to efficiently and safely navigate through arbitrarily complex traffic scenarios, ADS must have the ability to forecast the future trajectories of surrounding actors. Current state-of-the-art models are typically based on Recurrent, Graph and Convolutional networks, achieving noticeable results in the context of vehicle prediction. In this paper we explore the influence of attention in generative models for motion prediction, considering both physical and social context to compute the most plausible trajectories. We first encode the past trajectories using a LSTM network, which serves as input to a Multi-Head Self-Attention module that computes the social context. On the other hand, we formulate a weighted interpolation to calculate the velocity and orientation in the last observation frame in order to calculate acceptable target points, extracted from the driveable of the HDMap information, which represents our physical context. Finally, the input of our generator is a white noise vector sampled from a multivariate normal distribution while the social and physical context are its conditions, in order to predict plausible trajectories. We validate our method using the Argoverse Motion Forecasting Benchmark 1.1, achieving competitive unimodal results.

arxiv情報

著者 Carlos Gómez-Huélamo,Marcos V. Conde,Miguel Ortiz,Santiago Montiel,Rafael Barea,Luis M. Bergasa
発行日 2022-09-26 13:18:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク