A Neuromorphic Dataset for Object Segmentation in Indoor Cluttered Environment

要約

イベントベースのカメラを利用することで、モーション ブラー、低ダイナミック レンジ、および標準カメラの低時間サンプリングの問題をすべて解決できます。
ただし、セグメンテーション アルゴリズムのベンチマーク専用のイベント ベースのデータセット、特に、遮蔽されたシーンでのセグメンテーションに重要な深度情報を提供するデータセットが不足しています。
この論文では、屋内の雑然とした環境でオブジェクトをセグメンテーションするための高品質の 3D 空間および時間データセットである、新しいイベントベースのセグメンテーション データセット (ESD) を提案します。
提案されたデータセット ESD は、インスタンス マスクで手動で注釈が付けられた 14,166 の RGB フレームを含む 145 のシーケンスで構成されます。
ステレオ グラフィック構成の 2 つのイベントベースのカメラから全体で 2,188 万と 2,080 万のイベントがそれぞれ収集されます。
私たちの知る限り、卓上オブジェクトのこの密に注釈が付けられた 3D 時空間イベントベースのセグメンテーション ベンチマークは、この種のものとしては初めてのものです。
ESD をリリースすることで、高品質で挑戦的なセグメンテーション ベンチマークをコミュニティに提供できると期待しています。

要約(オリジナル)

Taking advantage of an event-based camera, the issues of motion blur, low dynamic range and low time sampling of standard cameras can all be addressed. However, there is a lack of event-based datasets dedicated to the benchmarking of segmentation algorithms, especially those that provide depth information which is critical for segmentation in occluded scenes. This paper proposes a new Event-based Segmentation Dataset (ESD), a high-quality 3D spatial and temporal dataset for object segmentation in an indoor cluttered environment. Our proposed dataset ESD comprises 145 sequences with 14,166 RGB frames that are manually annotated with instance masks. Overall 21.88 million and 20.80 million events from two event-based cameras in a stereo-graphic configuration are collected, respectively. To the best of our knowledge, this densely annotated and 3D spatial-temporal event-based segmentation benchmark of tabletop objects is the first of its kind. By releasing ESD, we expect to provide the community with a challenging segmentation benchmark with high quality.

arxiv情報

著者 Xiaoqian Huang,Kachole Sanket,Abdulla Ayyad,Fariborz Baghaei Naeini,Dimitrios Makris,Yahya Zweiri
発行日 2023-02-17 08:33:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.DB, cs.RO パーマリンク