SANPO: A Scene Understanding, Accessibility, Navigation, Pathfinding, Obstacle Avoidance Dataset

要約

屋外環境における密集予測に焦点を当てた大規模な自己中心的なビデオ データセットである SANPO を紹介します。
これには、さまざまな屋外環境で収集されたステレオ ビデオ セッションと、レンダリングされた合成ビデオ セッションが含まれています。
(合成データは Parallel Domain によって提供されました。) すべてのセッションには (密な) 深度とオドメトリ ラベルが付いています。
すべての合成セッションと実際のセッションのサブセットには、時間的に一貫した高密度のパノプティック セグメンテーション ラベルが付いています。
私たちの知る限り、これは大規模な高密度パノプティック セグメンテーションと深度アノテーションの両方を備えた最初の人間の自己中心的なビデオ データセットです。
データセットに加えて、将来の研究のためにゼロショット ベースラインと SANPO ベンチマークも提供します。
私たちは、SANPO の挑戦的な性質が、ヒューマン ナビゲーション システムを実現しながら、ビデオ セグメンテーション、深度推定、マルチタスクのビジュアル モデリング、および合成から現実のドメインへの適応における最先端技術の進歩に役立つことを期待しています。
SANPO はこちらから入手できます: https://google-research-datasets.github.io/sanpo_dataset/

要約(オリジナル)

We introduce SANPO, a large-scale egocentric video dataset focused on dense prediction in outdoor environments. It contains stereo video sessions collected across diverse outdoor environments, as well as rendered synthetic video sessions. (Synthetic data was provided by Parallel Domain.) All sessions have (dense) depth and odometry labels. All synthetic sessions and a subset of real sessions have temporally consistent dense panoptic segmentation labels. To our knowledge, this is the first human egocentric video dataset with both large scale dense panoptic segmentation and depth annotations. In addition to the dataset we also provide zero-shot baselines and SANPO benchmarks for future research. We hope that the challenging nature of SANPO will help advance the state-of-the-art in video segmentation, depth estimation, multi-task visual modeling, and synthetic-to-real domain adaptation, while enabling human navigation systems. SANPO is available here: https://google-research-datasets.github.io/sanpo_dataset/

arxiv情報

著者 Sagar M. Waghmare,Kimberly Wilber,Dave Hawkey,Xuan Yang,Matthew Wilson,Stephanie Debats,Cattalyya Nuengsigkapian,Astuti Sharma,Lars Pandikow,Huisheng Wang,Hartwig Adam,Mikhail Sirotenko
発行日 2023-09-21 15:28:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク