Human trajectory prediction using LSTM with Attention mechanism

要約

本論文では、Long Short-Term Memory(LSTM)ネットワークと注意メカニズムを組み合わせた人間の軌跡予測モデルを提案する。そのために、アテンションスコアを用いて、予測時にモデルが入力データのどの部分に注目すべきかを決定する。アテンション・スコアは各入力特徴について計算され、スコアが高いほど、出力を予測する上でその特徴がより重要であることを示す。最初に、これらのスコアは、ターゲットとなる人間の位置、速度、および隣接する個人の位置と速度について決定される。注意スコアを用いることで、我々のモデルは入力データ中の最も関連性の高い情報に優先順位を付け、より正確な予測を行うことができる。我々は注意メカニズムから注意スコアを抽出し、それを軌跡予測モジュールに統合することで、人間の将来の軌跡を予測する。これを実現するために、注意スコアを抽出した後に処理し、位置情報と連結する新しいニューラル層を導入する。公開されているETHデータセットとUCYデータセットで我々のアプローチを評価し、最終変位誤差(FDE)と平均変位誤差(ADE)メトリクスを用いてその性能を測定する。我々は、我々の修正アルゴリズムが、混雑した空間における歩行者の将来の軌跡を予測する際に、社会的LSTMよりも優れた性能を発揮することを示す。具体的には、我々のモデルは文献のSocial LSTMの結果と比較して、ADEで6.2%、FDEで6.3%の改善を達成した。

要約(オリジナル)

In this paper, we propose a human trajectory prediction model that combines a Long Short-Term Memory (LSTM) network with an attention mechanism. To do that, we use attention scores to determine which parts of the input data the model should focus on when making predictions. Attention scores are calculated for each input feature, with a higher score indicating the greater significance of that feature in predicting the output. Initially, these scores are determined for the target human position, velocity, and their neighboring individual’s positions and velocities. By using attention scores, our model can prioritize the most relevant information in the input data and make more accurate predictions. We extract attention scores from our attention mechanism and integrate them into the trajectory prediction module to predict human future trajectories. To achieve this, we introduce a new neural layer that processes attention scores after extracting them and concatenates them with positional information. We evaluate our approach on the publicly available ETH and UCY datasets and measure its performance using the final displacement error (FDE) and average displacement error (ADE) metrics. We show that our modified algorithm performs better than the Social LSTM in predicting the future trajectory of pedestrians in crowded spaces. Specifically, our model achieves an improvement of 6.2% in ADE and 6.3% in FDE compared to the Social LSTM results in the literature.

arxiv情報

著者 Amin Manafi Soltan Ahmadi,Samaneh Hoseini Semnani
発行日 2023-09-01 08:35:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.RO パーマリンク