Implicit Occupancy Flow Fields for Perception and Prediction in Self-Driving

要約

自動運転車(SDV)は、周囲の状況を認識し、他の交通参加者の将来の行動を予測できなければならない。既存の研究では、物体検出の後に検出された物体の軌跡予測を行うか、シーン全体の密な占有率と流れのグリッドを予測する。前者は、効率上の理由から検出数を低く抑える必要があり、物体の想起性が犠牲になるため、安全性に懸念がある。後者は、出力グリッドの高次元のため計算コストが高く、完全畳み込みネットワーク特有の限られた受容野に悩まされる。さらに、どちらのアプローチも、モーションプランナーが決して問い合わせないかもしれない領域やオブジェクトを予測するために、多くの計算資源を使う。このことが、1つのニューラルネットワークで暗黙のうちに占有率と時間的な流れを表現する、知覚と将来予測に対する我々の統一的なアプローチの動機付けとなる。我々の手法は、連続的な時空間位置においてモーションプランナーから直接問い合わせを受けることができるため、不必要な計算を避けることができる。さらに、効率的かつ効果的なグローバルアテンションメカニズムを追加することで、これまでの明示的占有予測手法の限定された受容野を克服するアーキテクチャを設計する。都市と高速道路の両方における広範な実験を通して、我々の暗黙的モデルが現在の最先端技術を凌駕することを実証する。詳細については、プロジェクトのウェブサイトhttps://waabi.ai/research/implicito。

要約(オリジナル)

A self-driving vehicle (SDV) must be able to perceive its surroundings and predict the future behavior of other traffic participants. Existing works either perform object detection followed by trajectory forecasting of the detected objects, or predict dense occupancy and flow grids for the whole scene. The former poses a safety concern as the number of detections needs to be kept low for efficiency reasons, sacrificing object recall. The latter is computationally expensive due to the high-dimensionality of the output grid, and suffers from the limited receptive field inherent to fully convolutional networks. Furthermore, both approaches employ many computational resources predicting areas or objects that might never be queried by the motion planner. This motivates our unified approach to perception and future prediction that implicitly represents occupancy and flow over time with a single neural network. Our method avoids unnecessary computation, as it can be directly queried by the motion planner at continuous spatio-temporal locations. Moreover, we design an architecture that overcomes the limited receptive field of previous explicit occupancy prediction methods by adding an efficient yet effective global attention mechanism. Through extensive experiments in both urban and highway settings, we demonstrate that our implicit model outperforms the current state-of-the-art. For more information, visit the project website: https://waabi.ai/research/implicito.

arxiv情報

著者 Ben Agro,Quinlan Sykora,Sergio Casas,Raquel Urtasun
発行日 2023-08-02 23:39:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク