IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic

要約

インテリジェント車両システムでは、安全で効率的なナビゲーションのために、道路状況、周囲のエンティティ、自車両の運転動作の間の相互作用を深く理解する必要があります。
これは、交通状況が密集し、異種の道路占有者が混在する構造化されていないことが多い発展途上国では特に重要です。
既存のデータセットは、主に構造化されたまばらな交通シナリオを対象としており、そのような環境での運転の複雑さを捉えるには至っていません。
このギャップを埋めるために、大規模なデュアルビュー運転ビデオ データセットである IDD-X を紹介します。
IDD-X は、697K のバウンディング ボックス、9K の重要なオブジェクト トラック、ビデオごとに 1 ~ 12 個のオブジェクトを備え、10 のカテゴリと 19 の説明ラベル カテゴリをカバーする複数の重要な道路オブジェクトに対して包括的な自己相対アノテーションを提供します。
このデータセットには、運転環境をより完全に表現するための後方視界の情報も組み込まれています。
また、複数の重要なオブジェクトの位置特定とオブジェクトごとの説明予測を目的としたカスタム設計のディープ ネットワークも紹介します。
全体として、私たちのデータセットと導入された予測モデルは、道路状況と周囲の存在が複雑な交通状況での運転行動にどのような影響を与えるかを研究するための基盤を形成します。

要約(オリジナル)

Intelligent vehicle systems require a deep understanding of the interplay between road conditions, surrounding entities, and the ego vehicle’s driving behavior for safe and efficient navigation. This is particularly critical in developing countries where traffic situations are often dense and unstructured with heterogeneous road occupants. Existing datasets, predominantly geared towards structured and sparse traffic scenarios, fall short of capturing the complexity of driving in such environments. To fill this gap, we present IDD-X, a large-scale dual-view driving video dataset. With 697K bounding boxes, 9K important object tracks, and 1-12 objects per video, IDD-X offers comprehensive ego-relative annotations for multiple important road objects covering 10 categories and 19 explanation label categories. The dataset also incorporates rearview information to provide a more complete representation of the driving environment. We also introduce custom-designed deep networks aimed at multiple important object localization and per-object explanation prediction. Overall, our dataset and introduced prediction models form the foundation for studying how road conditions and surrounding entities affect driving behavior in complex traffic situations.

arxiv情報

著者 Chirag Parikh,Rohit Saluja,C. V. Jawahar,Ravi Kiran Sarvadevabhatla
発行日 2024-04-12 16:00:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク