Classification and regression of trajectories rendered as images via 2D Convolutional Neural Networks

要約

軌跡は、通常は運動性の物体から生じる時系列の座標とみなすことができます。
軌道分類の方法はさまざまな運動パターンを検出するために特に重要であり、一方、回帰の方法は運動性メトリクスと予測を計算するために重要です。
コンピューター ビジョンの最近の進歩により、2D 畳み込み層 (CNN) を備えた人工ニューラル ネットワークを介して画像としてレンダリングされた軌跡の処理が容易になりました。
このアプローチは、複雑な形状を認識するために必要な、画像から特徴の空間階層を学習する CNN の機能を活用します。
さらに、固定数の点を持つ入力軌跡を必要とする他の機械学習手法の制限も克服されます。
ただし、軌跡を画像としてレンダリングすると、離散グリッド上の座標のプロットによる情報損失や、線の太さやエイリアシングによるスペクトルの変化など、調査が不十分なアーティファクトが発生する可能性があります。
この研究では、さまざまなモダリティを使用して画像としてレンダリングされた合成軌跡から分類および回帰問題を解決するための CNN の有効性を調査します。
この研究で考慮されるパラメータには、線の太さ、画像解像度、動き履歴の使用 (時間成分の色分け)、およびアンチエイリアスが含まれます。
この結果は、動きの方向が重要なアプリケーションにおいて、モデルの深さと動きの履歴に応じて適切な画像解像度を選択することの重要性を浮き彫りにしています。

要約(オリジナル)

Trajectories can be regarded as time-series of coordinates, typically arising from motile objects. Methods for trajectory classification are particularly important to detect different movement patterns, while methods for regression to compute motility metrics and forecasting. Recent advances in computer vision have facilitated the processing of trajectories rendered as images via artificial neural networks with 2d convolutional layers (CNNs). This approach leverages the capability of CNNs to learn spatial hierarchies of features from images, necessary to recognize complex shapes. Moreover, it overcomes the limitation of other machine learning methods that require input trajectories with a fixed number of points. However, rendering trajectories as images can introduce poorly investigated artifacts such as information loss due to the plotting of coordinates on a discrete grid, and spectral changes due to line thickness and aliasing. In this study, we investigate the effectiveness of CNNs for solving classification and regression problems from synthetic trajectories that have been rendered as images using different modalities. The parameters considered in this study include line thickness, image resolution, usage of motion history (color-coding of the temporal component) and anti-aliasing. Results highlight the importance of choosing an appropriate image resolution according to model depth and motion history in applications where movement direction is critical.

arxiv情報

著者 Mariaclaudia Nicolai,Raffaella Fiamma Cabini,Diego Ulisse Pizzagalli
発行日 2024-09-27 15:27:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク