COVERED, CollabOratiVE Robot Environment Dataset for 3D Semantic segmentation

要約

タイトル:COVERED、3Dセマンティックセグメンテーションのためのコラボレーションロボット環境データセット

要約:

– 人間とロボットの協働性(HRC)の安全性が、新たな産業5.0パラダイムの登場に伴い注目されている。
– 従来のロボットは、より知的で柔軟な協働ロボット(コボット)に置き換えられている。
– コボットと人間の安全で効率的な協働は、工業環境の動的周囲の包括的なセマンティック理解に大きく依存する。
– このようなアプリケーションにおけるセマンティック理解の重要性にもかかわらず、コラボレーションロボットのワークスペースの3Dセマンティックセグメンテーションには十分な研究と専用のデータセットが欠如している。
– 不十分なデータセットによって引き起こされる性能制限を「データ飢餓」問題と呼ぶ。
– 現在の制限を克服するために、この作品は、名前が「COVERED」のこの用途に特化した新しいデータセットを開発し、点ごとに注釈されたロボットセルのポイントクラウドを含める。
– 最後に、私たちはまた、データセット上の現在の最先端アルゴリズムのパフォーマンスのベンチマークを提供し、マルチLiDARシステムを使用してコラボレーションロボットのワークスペースのリアルタイムセマンティックセグメンテーションを実証する。
– リアルタイムで動的に変化する状況で訓練されたDeep Networksを使用した有望な結果は、私たちが正しい方向に向かっていることを示しています。
– 私たちのパーセプションパイプラインは、予測ポイントの精度が96%を超え、平均交差信頼度(mIOU)が92%以上で、8Hzのスループットを維持しながら、20Hzのスループットを達成しています。

要約(オリジナル)

Safe human-robot collaboration (HRC) has recently gained a lot of interest with the emerging Industry 5.0 paradigm. Conventional robots are being replaced with more intelligent and flexible collaborative robots (cobots). Safe and efficient collaboration between cobots and humans largely relies on the cobot’s comprehensive semantic understanding of the dynamic surrounding of industrial environments. Despite the importance of semantic understanding for such applications, 3D semantic segmentation of collaborative robot workspaces lacks sufficient research and dedicated datasets. The performance limitation caused by insufficient datasets is called ‘data hunger’ problem. To overcome this current limitation, this work develops a new dataset specifically designed for this use case, named ‘COVERED’, which includes point-wise annotated point clouds of a robotic cell. Lastly, we also provide a benchmark of current state-of-the-art (SOTA) algorithm performance on the dataset and demonstrate a real-time semantic segmentation of a collaborative robot workspace using a multi-LiDAR system. The promising results from using the trained Deep Networks on a real-time dynamically changing situation shows that we are on the right track. Our perception pipeline achieves 20Hz throughput with a prediction point accuracy of $>$96\% and $>$92\% mean intersection over union (mIOU) while maintaining an 8Hz throughput.

arxiv情報

著者 Charith Munasinghe,Fatemeh Mohammadi Amin,Davide Scaramuzza,Hans Wernher van de Venn
発行日 2023-04-04 09:06:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.RO パーマリンク