要約
既存の方法の 2 つの欠点に対処するために、(i) ほぼすべてのモデルが高解像度 (HD) マップに依存していますが、実際の交通シーンではマップ情報が常に利用できるとは限らず、HD マップの構築には費用と時間がかかります。
ii) 既存のモデルは通常、計算効率の低下を犠牲にして予測精度の向上に重点を置いていますが、実際のさまざまなアプリケーションにとって効率は非常に重要であるため、この論文では交通地図に依存しない効率的な軌道予測モデルを提案します。
私たちのモデルの核となるアイデアは、第 1 段階で単一エージェントの時空間情報をエンコードし、第 2 段階でマルチエージェントの時空間相互作用を探索することです。
注意メカニズム、LSTM、グラフ畳み込みネットワーク、時間変換器を 2 段階で包括的に利用することにより、私たちのモデルはすべてのエージェントの豊富な動的情報とインタラクション情報を学習することができます。
私たちのモデルは、既存のマップフリーのメソッドと比較した場合に最高のパフォーマンスを実現し、Argoverse データセット上のほとんどのマップベースの最先端のメソッドも上回っています。
さらに、私たちのモデルは、ベースライン手法よりも速い推論速度も示しています。
要約(オリジナル)
To handle the two shortcomings of existing methods, (i)nearly all models rely on high-definition (HD) maps, yet the map information is not always available in real traffic scenes and HD map-building is expensive and time-consuming and (ii) existing models usually focus on improving prediction accuracy at the expense of reducing computing efficiency, yet the efficiency is crucial for various real applications, this paper proposes an efficient trajectory prediction model that is not dependent on traffic maps. The core idea of our model is encoding single-agent’s spatial-temporal information in the first stage and exploring multi-agents’ spatial-temporal interactions in the second stage. By comprehensively utilizing attention mechanism, LSTM, graph convolution network and temporal transformer in the two stages, our model is able to learn rich dynamic and interaction information of all agents. Our model achieves the highest performance when comparing with existing map-free methods and also exceeds most map-based state-of-the-art methods on the Argoverse dataset. In addition, our model also exhibits a faster inference speed than the baseline methods.
arxiv情報
著者 | Junhong Xiang,Jingmin Zhang,Zhixiong Nan |
発行日 | 2023-07-19 08:36:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google