要約
Habitat-Matterport 3D Semantics (HM3DSEM) データセットを紹介します。
HM3DSEM は、現在学術コミュニティが利用できる、密に注釈が付けられたセマンティクスを持つ 3D 実世界空間の最大のデータセットです。
これは、216 の 3D 空間とそれらの空間内の 3,100 の部屋にわたる 142,646 のオブジェクト インスタンス アノテーションで構成されています。
オブジェクト アノテーションの規模、品質、多様性は、以前の作業のデータセットをはるかに上回っています。
HM3DSEM を他のデータセットと区別する主な違いは、テクスチャ情報を使用してピクセル精度のオブジェクト境界に注釈を付けることです。
さまざまな方法を使用して、オブジェクト ゴール ナビゲーション タスクに対する HM3DSEM データセットの有効性を示します。
HM3DSEM を使用してトレーニングされたポリシーは、以前のデータセットでトレーニングされたものと同等以上のパフォーマンスを発揮します。
要約(オリジナル)
We present the Habitat-Matterport 3D Semantics (HM3DSEM) dataset. HM3DSEM is the largest dataset of 3D real-world spaces with densely annotated semantics that is currently available to the academic community. It consists of 142,646 object instance annotations across 216 3D spaces and 3,100 rooms within those spaces. The scale, quality, and diversity of object annotations far exceed those of datasets from prior work. A key difference setting apart HM3DSEM from other datasets is the use of texture information to annotate pixel-accurate object boundaries. We demonstrate the effectiveness of HM3DSEM dataset for the Object Goal Navigation task using different methods. Policies trained using HM3DSEM perform comparable or better than those trained on prior datasets.
arxiv情報
著者 | Karmesh Yadav,Ram Ramrakhya,Santhosh Kumar Ramakrishnan,Theo Gervet,John Turner,Aaron Gokaslan,Noah Maestre,Angel Xuan Chang,Dhruv Batra,Manolis Savva,Alexander William Clegg,Devendra Singh Chaplot |
発行日 | 2022-10-11 17:25:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google