City-Scale Multi-Camera Vehicle Tracking System with Improved Self-Supervised Camera Link Model

要約

マルチターゲット マルチカメラ追跡 (MTMCT) には幅広い用途があり、将来の都市全体の多数のシステム (交通管理、衝突検出など) の基礎を形成します。
ただし、特徴抽出のみに基づいてさまざまなカメラ間で車両の軌跡を一致させるという課題は、大きな困難を引き起こします。
この記事では、自己監視カメラリンクモデルを利用した革新的なマルチカメラ車両追跡システムを紹介します。
手動の時空間アノテーションに依存する関連作業とは対照的に、私たちのモデルは、車両のマッチングに重要なマルチカメラの関係を自動的に抽出します。
カメラ リンクは、高品質トラックの特徴の類似性、ペア数、時間分散を評価する事前マッチング プロセスを通じて確立されます。
このプロセスでは、すべてのカメラの組み合わせの空間リンクの確率を計算し、最高スコアのペアを選択してカメラ リンクを作成します。
私たちのアプローチは、人間による注釈の必要性を排除することで導入時間を大幅に短縮し、実際のアプリケーションにおいて効率と費用対効果が大幅に向上します。
このペアリング プロセスは、時空間制約を設定することでクロスカメラ マッチングをサポートし、潜在的な車両一致の検索スペースを削減します。
実験結果によると、提案された方法は、CityFlow V2 ベンチマークで 61.07% の IDF1 スコアを備えた自動カメラリンク ベースの方法の中で新しい最先端を達成しました。

要約(オリジナル)

Multi-Target Multi-Camera Tracking (MTMCT) has broad applications and forms the basis for numerous future city-wide systems (e.g. traffic management, crash detection, etc.). However, the challenge of matching vehicle trajectories across different cameras based solely on feature extraction poses significant difficulties. This article introduces an innovative multi-camera vehicle tracking system that utilizes a self-supervised camera link model. In contrast to related works that rely on manual spatial-temporal annotations, our model automatically extracts crucial multi-camera relationships for vehicle matching. The camera link is established through a pre-matching process that evaluates feature similarities, pair numbers, and time variance for high-quality tracks. This process calculates the probability of spatial linkage for all camera combinations, selecting the highest scoring pairs to create camera links. Our approach significantly improves deployment times by eliminating the need for human annotation, offering substantial improvements in efficiency and cost-effectiveness when it comes to real-world application. This pairing process supports cross camera matching by setting spatial-temporal constraints, reducing the searching space for potential vehicle matches. According to our experimental results, the proposed method achieves a new state-of-the-art among automatic camera-link based methods in CityFlow V2 benchmarks with 61.07% IDF1 Score.

arxiv情報

著者 Yuqiang Lin,Sam Lockyer,Adrian Evans,Markus Zarbock,Nic Zhang
発行日 2024-07-09 14:24:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク