要約
従来のレーダー特徴抽出は、低い空間分解能、ノイズ、マルチパス反射、ゴーストターゲットの存在、モーションブラーによる限界に直面している。このような限界は、特にエゴセントリックな視点からの非線形な物体運動によって悪化する可能性があります。このような課題に対処するためには、有効な関連付けのために、拡大された視野にわたる時間的な特徴関係を利用し、空間的な動きの一貫性を強制することに鍵があることが明らかになった。この目的のため、本稿では2つの設計を持つSIRA(Scalable Inter-frame Relation and Association)を提案する。第一に、Swin Transformerに触発され、拡張された時間的関係を導入し、既存の時間的関係レイヤーを、スケーラビリティのために、時間的に再グループ化されたウィンドウアテンションを持つ、連続する2フレームから複数のフレーム間へと一般化する。第二に、より良い軌跡予測とその後のオブジェクトの関連付けのために、観測データから生成された擬似トラックレットの概念を用いた動き一貫性トラックを提案する。我々のアプローチは、Radiateデータセットにおいて、指向性物体検出で58.11 mAP@0.5 を、複数物体追跡で47.79 MOTAを達成し、それぞれ+4.11 mAP@0.5 と+9.94 MOTAのマージンをもって、従来の最先端技術を上回る。
要約(オリジナル)
Conventional radar feature extraction faces limitations due to low spatial resolution, noise, multipath reflection, the presence of ghost targets, and motion blur. Such limitations can be exacerbated by nonlinear object motion, particularly from an ego-centric viewpoint. It becomes evident that to address these challenges, the key lies in exploiting temporal feature relation over an extended horizon and enforcing spatial motion consistency for effective association. To this end, this paper proposes SIRA (Scalable Inter-frame Relation and Association) with two designs. First, inspired by Swin Transformer, we introduce extended temporal relation, generalizing the existing temporal relation layer from two consecutive frames to multiple inter-frames with temporally regrouped window attention for scalability. Second, we propose motion consistency track with the concept of a pseudo-tracklet generated from observational data for better trajectory prediction and subsequent object association. Our approach achieves 58.11 mAP@0.5 for oriented object detection and 47.79 MOTA for multiple object tracking on the Radiate dataset, surpassing previous state-of-the-art by a margin of +4.11 mAP@0.5 and +9.94 MOTA, respectively.
arxiv情報
著者 | Ryoma Yataka,Pu Perry Wang,Petros Boufounos,Ryuhei Takahashi |
発行日 | 2024-11-04 16:14:35+00:00 |
arxivサイト | arxiv_id(pdf) |