Distilling Knowledge for Short-to-Long Term Trajectory Prediction

要約

長期的な軌道予測は、コンピューター ビジョン、機械学習、ロボット工学の分野における重要かつ困難な問題です。
根本的な問題の 1 つは、時間軸が長くなるにつれてますます不確実で予測不可能になり、問題の複雑さが増大する軌跡の展開にあります。
この問題を克服するために、この論文では、トレーニング プロセス中に長期軌道予測のためにスチューデント ネットワークをガイドする短期軌道モデル予測器の蒸留を使用する新しい方法である Di-Long を提案します。
学生ネットワークの許容される観察と相補的なターゲット シーケンスを含むシーケンスの合計長が与えられた場合、学生と教師に、同じ完全な軌跡にわたって定義された 2 つの異なる関連タスクを解決させます。学生は短いシーケンスを観察し、長い軌跡を予測します。
一方、教師はより長いシーケンスを観察し、残りの短いターゲットの軌道を予測します。
教師の課題は不確実性が低く、その正確な予測を使用して知識抽出フレームワークを通じて生徒をガイドし、長期的な将来の不確実性を軽減します。
私たちの実験は、私たちが提案した Di-Long 法が長期予測に効果的であり、交差点ドローン データセット (inD) とスタンフォード ドローン データセット (SDD) で最先端のパフォーマンスを達成することを示しています。

要約(オリジナル)

Long-term trajectory forecasting is an important and challenging problem in the fields of computer vision, machine learning, and robotics. One fundamental difficulty stands in the evolution of the trajectory that becomes more and more uncertain and unpredictable as the time horizon grows, subsequently increasing the complexity of the problem. To overcome this issue, in this paper, we propose Di-Long, a new method that employs the distillation of a short-term trajectory model forecaster that guides a student network for long-term trajectory prediction during the training process. Given a total sequence length that comprehends the allowed observation for the student network and the complementary target sequence, we let the student and the teacher solve two different related tasks defined over the same full trajectory: the student observes a short sequence and predicts a long trajectory, whereas the teacher observes a longer sequence and predicts the remaining short target trajectory. The teacher’s task is less uncertain, and we use its accurate predictions to guide the student through our knowledge distillation framework, reducing long-term future uncertainty. Our experiments show that our proposed Di-Long method is effective for long-term forecasting and achieves state-of-the-art performance on the Intersection Drone Dataset (inD) and the Stanford Drone Dataset (SDD).

arxiv情報

著者 Sourav Das,Guglielmo Camporese,Shaokang Cheng,Lamberto Ballan
発行日 2024-03-15 10:53:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク