VT-Former: An Exploratory Study on Vehicle Trajectory Prediction for Highway Surveillance through Graph Isomorphism and Transformer

要約

道路の安全性の向上は、高度道路交通システム (ITS) にとって不可欠なコンピューター ビジョンの重点分野となっています。
ITS の一部として、車両軌道予測 (VTP) は、車両の過去と現在の動きに基づいて車両の将来の位置を予測することを目的としています。
VTP は交通安全にとって極めて重要な要素であり、交通管理、事故防止、作業区域の安全、エネルギー最適化などのアプリケーションに役立ちます。
この分野のほとんどの研究は自動運転に焦点を当てていますが、監視カメラの数が増加するにつれて、独自の一連の課題を伴う監視 VTP の別のサブ分野が出現しています。
このホワイトペーパーでは、高速道路の安全性と監視のための新しい変圧器ベースの VTP アプローチである VT-Former を紹介します。
変圧器を利用して長距離の時間的パターンを捕捉することに加えて、車両間の複雑な社会的相互作用を捕捉するための新しいグラフ アテンティブ トークン化 (GAT) モジュールが提案されています。
この研究は、変圧器アーキテクチャと VTP のグラフを組み合わせることに固有の利点と限界の両方を調査することを目的としています。
さまざまな監視観点から 3 つのベンチマーク データセットにわたって実施された私たちの調査は、車両軌道の予測における VT-Former の最先端 (SotA) または同等のパフォーマンスを示しています。
この研究は、VT-Former とそのアーキテクチャの可能性を強調し、将来の研究と探索に新たな道を切り開きます。

要約(オリジナル)

Enhancing roadway safety has become an essential computer vision focus area for Intelligent Transportation Systems (ITS). As a part of ITS, Vehicle Trajectory Prediction (VTP) aims to forecast a vehicle’s future positions based on its past and current movements. VTP is a pivotal element for road safety, aiding in applications such as traffic management, accident prevention, work-zone safety, and energy optimization. While most works in this field focus on autonomous driving, with the growing number of surveillance cameras, another sub-field emerges for surveillance VTP with its own set of challenges. In this paper, we introduce VT-Former, a novel transformer-based VTP approach for highway safety and surveillance. In addition to utilizing transformers to capture long-range temporal patterns, a new Graph Attentive Tokenization (GAT) module has been proposed to capture intricate social interactions among vehicles. This study seeks to explore both the advantages and the limitations inherent in combining transformer architecture with graphs for VTP. Our investigation, conducted across three benchmark datasets from diverse surveillance viewpoints, showcases the State-of-the-Art (SotA) or comparable performance of VT-Former in predicting vehicle trajectories. This study underscores the potential of VT-Former and its architecture, opening new avenues for future research and exploration.

arxiv情報

著者 Armin Danesh Pazho,Ghazal Alinezhad Noghre,Vinit Katariya,Hamed Tabkhi
発行日 2024-04-23 15:56:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク