FusionSORT: Fusion Methods for Online Multi-object Visual Tracking


この研究では、複数のオブジェクトの視覚追跡において検出をトラックレットに関連付ける 4 つの異なる融合方法を調査します。
動きや外観情報などの強い手がかりを考慮することに加えて、さまざまな融合方法を使用して、高さ交差オーバーユニオン (高さ IoU) やデータ関連付けにおけるトラックレットの信頼情報などの弱い手がかりも考慮します。
これらの融合方法には、IoU、カルマン フィルター (KF) ゲーティング、およびさまざまなキューに基づくコストのアダマール積に基づく最小の加重合計が含まれます。
私たちは、MOT17、MOT20、および DanceTrack データセットの検証セットに対して広範な評価を実施し、マルチオブジェクト視覚追跡におけるデータ関連付けには融合方法の選択が鍵であることがわかりました。
私たちは、この調査作業が、コンピュータ ビジョン研究コミュニティが複数オブジェクトの視覚追跡におけるデータ関連付けに適切な融合手法を使用するのに役立つことを願っています。


In this work, we investigate four different fusion methods for associating detections to tracklets in multi-object visual tracking. In addition to considering strong cues such as motion and appearance information, we also consider weak cues such as height intersection-over-union (height-IoU) and tracklet confidence information in the data association using different fusion methods. These fusion methods include minimum, weighted sum based on IoU, Kalman filter (KF) gating, and hadamard product of costs due to the different cues. We conduct extensive evaluations on validation sets of MOT17, MOT20 and DanceTrack datasets, and find out that the choice of a fusion method is key for data association in multi-object visual tracking. We hope that this investigative work helps the computer vision research community to use the right fusion method for data association in multi-object visual tracking.


