Revisiting the Temporal Modeling in Spatio-Temporal Predictive Learning under A Unified View

要約

時空間予測学習は自己教師あり学習において重要な役割を果たしており、さまざまな分野に幅広く応用されています。
時間モデリングに対するこれまでのアプローチは、リカレントベースの方法とリカレントフリーの方法という 2 つのカテゴリに分類されます。
前者はフレームを 1 つずつ注意深く処理する一方で、短期的な時空間情報の冗長性を無視し、非効率につながります。
後者は単純にフレームを順番にスタックし、固有の時間的依存関係を無視します。
この論文では、時空間予測学習の領域内で 2 つの主要な時間モデリング アプローチを再検討し、統一された視点を提供します。
この分析に基づいて、ミクロ時間スケールとマクロ時間スケールの両方を統合することで、リカレントベースの方法とリカレントフリーの方法を調和させる革新的なフレームワークである USTEP (統合時空間予測学習) を紹介します。
幅広い時空間予測学習に関する広範な実験により、USTEP が既存の時間モデリング アプローチに対して大幅な改善を達成し、それによって幅広い時空間アプリケーションに対する堅牢なソリューションとして確立されることが実証されました。

要約(オリジナル)

Spatio-temporal predictive learning plays a crucial role in self-supervised learning, with wide-ranging applications across a diverse range of fields. Previous approaches for temporal modeling fall into two categories: recurrent-based and recurrent-free methods. The former, while meticulously processing frames one by one, neglect short-term spatio-temporal information redundancies, leading to inefficiencies. The latter naively stack frames sequentially, overlooking the inherent temporal dependencies. In this paper, we re-examine the two dominant temporal modeling approaches within the realm of spatio-temporal predictive learning, offering a unified perspective. Building upon this analysis, we introduce USTEP (Unified Spatio-TEmporal Predictive learning), an innovative framework that reconciles the recurrent-based and recurrent-free methods by integrating both micro-temporal and macro-temporal scales. Extensive experiments on a wide range of spatio-temporal predictive learning demonstrate that USTEP achieves significant improvements over existing temporal modeling approaches, thereby establishing it as a robust solution for a wide range of spatio-temporal applications.

arxiv情報

著者 Cheng Tan,Jue Wang,Zhangyang Gao,Siyuan Li,Lirong Wu,Jun Xia,Stan Z. Li
発行日 2023-10-09 16:17:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク