Pedestrian 3D Bounding Box Prediction

要約

自動運転の課題は依然として安全性であり、グローバルに展開するためには、歩行者の動きを事前に十分に予測する必要があります。
粗視化(人間の中心の予測)と細粒度の予測(人体のキーポイントの予測)に関する多くの研究がありますが、自律型車両の複雑なモーションの詳細をモデル化することなく、人間の合理的な推定である3Dバウンディングボックスに焦点を当てています。
これにより、実際の設定でより長い期間を予測する柔軟性が得られます。
この新しい問題を提案し、歩行者の3Dバウンディングボックス予測のためのシンプルで効果的なモデルを提示します。
この方法は、リカレントニューラルネットワークに基づくエンコーダー-デコーダーアーキテクチャに従い、私たちの実験は、合成(JTA)データセットと実世界(NuScenes)データセットの両方でその有効性を示しています。
学習した表現には、アクションの予測など、他のタスクのパフォーマンスを向上させるための有用な情報が含まれています。
私たちのコードはオンラインで入手できます:https://github.com/vita-epfl/bounding-box-prediction

要約(オリジナル)

Safety is still the main issue of autonomous driving, and in order to be globally deployed, they need to predict pedestrians’ motions sufficiently in advance. While there is a lot of research on coarse-grained (human center prediction) and fine-grained predictions (human body keypoints prediction), we focus on 3D bounding boxes, which are reasonable estimates of humans without modeling complex motion details for autonomous vehicles. This gives the flexibility to predict in longer horizons in real-world settings. We suggest this new problem and present a simple yet effective model for pedestrians’ 3D bounding box prediction. This method follows an encoder-decoder architecture based on recurrent neural networks, and our experiments show its effectiveness in both the synthetic (JTA) and real-world (NuScenes) datasets. The learned representation has useful information to enhance the performance of other tasks, such as action anticipation. Our code is available online: https://github.com/vita-epfl/bounding-box-prediction

arxiv情報

著者 Saeed Saadatnejad,Yi Zhou Ju,Alexandre Alahi
発行日 2022-06-28 17:59:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク