ROAD-Waymo: Action Awareness at Scale for Autonomous Driving

要約

自動運転車 (AV) 認識システムでは、物体検出やシーン分割など、単に見るだけでは不十分です。
他の道路利用者と安全にやり取りするには、現場で何が起こっているのかを総合的に理解する必要があります。
他の道路利用者の行動を理解するためのアルゴリズムの開発とトレーニングを目的としたデータセットはほとんど存在しません。
この論文では、道路シーンにおけるエージェント、アクション、位置、およびイベントの検出技術の開発とベンチマークのための広範なデータセットである ROAD-Waymo について説明します。これは、(米国) Waymo Open データセット上のレイヤーとして提供されます。
既存のデータセットよりもかなり大きく、より困難なデータセット (複数の都市を含む) には、198,000 個の注釈付きビデオ フレーム、54,000 個のエージェント チューブ、390 万個のバウンディング ボックス、合計 1240 万個のラベルが含まれています。
データセットの整合性は、このデータセット用に特別に設計された要件の違反を自動的に識別するように設計された新しいアノテーション パイプラインによって確認および強化されています。
ROAD-Waymo はオリジナル (英国) ROAD データセットと互換性があるため、新しいベンチマークである ROAD++ 内で、さまざまな国の現実世界の道路シナリオ間のドメイン適応に取り組む機会を提供します。

要約(オリジナル)

Autonomous Vehicle (AV) perception systems require more than simply seeing, via e.g., object detection or scene segmentation. They need a holistic understanding of what is happening within the scene for safe interaction with other road users. Few datasets exist for the purpose of developing and training algorithms to comprehend the actions of other road users. This paper presents ROAD-Waymo, an extensive dataset for the development and benchmarking of techniques for agent, action, location and event detection in road scenes, provided as a layer upon the (US) Waymo Open dataset. Considerably larger and more challenging than any existing dataset (and encompassing multiple cities), it comes with 198k annotated video frames, 54k agent tubes, 3.9M bounding boxes and a total of 12.4M labels. The integrity of the dataset has been confirmed and enhanced via a novel annotation pipeline designed for automatically identifying violations of requirements specifically designed for this dataset. As ROAD-Waymo is compatible with the original (UK) ROAD dataset, it provides the opportunity to tackle domain adaptation between real-world road scenarios in different countries within a novel benchmark: ROAD++.

arxiv情報

著者 Salman Khan,Izzeddin Teeti,Reza Javanmard Alitappeh,Mihaela C. Stoian,Eleonora Giunchiglia,Gurkirt Singh,Andrew Bradley,Fabio Cuzzolin
発行日 2024-11-08 12:50:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク