要約
長期的な人間の軌跡予測は、ロボット工学や自律システムにおいて、困難かつ重要なタスクです。
単峰性の特徴のみを使用して人間の短期的な正確な軌跡を予測する方法を研究した以前の研究では、長期的な予測に失敗することがよくありました。
強化学習は人間の長期的な行動を学習するための優れたソリューションを提供しますが、データの効率と最適化において課題が生じる可能性があります。
この研究では、誘導拡散モデルを活用して、VQ-VAEを使用した階層的行動量子化スキームによって取得された高レベルの潜在行動空間で多様な長期的な人間の行動を生成する、長期的な人間の軌跡予測フレームワークを提案します。
連続的な軌跡と利用可能なコンテキストを離散化します。
潜在的なアクションは、テスト時に物理学にヒントを得たガイダンスを使用して、生成されるマルチモーダルなアクション分布を制限するガイド付き拡散モデルによって予測されます。
具体的には、逆ノイズ除去プロセス中に到達可能性分析を使用して、物理的に実行可能な潜在的なアクションに向けて拡散ステップを導きます。
私たちは、公的に利用可能な 2 つの人間の軌跡予測データセット、SFU-Store-Nav と JRDB に基づいてフレームワークを評価しました。広範な実験結果は、私たちのフレームワークが長期的な人間の軌跡予測において優れたパフォーマンスを達成することを示しています。
要約(オリジナル)
Long-term human trajectory prediction is a challenging yet critical task in robotics and autonomous systems. Prior work that studied how to predict accurate short-term human trajectories with only unimodal features often failed in long-term prediction. Reinforcement learning provides a good solution for learning human long-term behaviors but can suffer from challenges in data efficiency and optimization. In this work, we propose a long-term human trajectory forecasting framework that leverages a guided diffusion model to generate diverse long-term human behaviors in a high-level latent action space, obtained via a hierarchical action quantization scheme using a VQ-VAE to discretize continuous trajectories and the available context. The latent actions are predicted by our guided diffusion model, which uses physics-inspired guidance at test time to constrain generated multimodal action distributions. Specifically, we use reachability analysis during the reverse denoising process to guide the diffusion steps toward physically feasible latent actions. We evaluate our framework on two publicly available human trajectory forecasting datasets: SFU-Store-Nav and JRDB, and extensive experimental results show that our framework achieves superior performance in long-term human trajectory forecasting.
arxiv情報
著者 | Zhitian Zhang,Anjian Li,Angelica Lim,Mo Chen |
発行日 | 2024-05-29 21:13:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google