COVERED, CollabOratiVE Robot Environment Dataset for 3D Semantic segmentation

要約

安全なヒューマン ロボット コラボレーション (HRC) は、最近出現したインダストリー 5.0 パラダイムで多くの関心を集めています。
従来のロボットは、よりインテリジェントで柔軟な協働ロボット (コボット) に置き換えられています。
協働ロボットと人間との間の安全で効率的なコラボレーションは、産業環境の動的な環境に対する協働ロボットの包括的な意味理解に大きく依存しています。
このようなアプリケーションのセマンティック理解の重要性にもかかわらず、協働ロボット ワークスペースの 3D セマンティック セグメンテーションには、十分な研究と専用のデータセットが不足しています。
不十分なデータセットによって引き起こされるパフォーマンスの制限は、「データ ハンガー」問題と呼ばれます。
この現在の制限を克服するために、この作業では、このユースケース用に特別に設計された「COVERED」という名前の新しいデータセットを開発します。これには、ロボットセルの点ごとに注釈が付けられた点群が含まれます。
最後に、データセットに対する現在の最先端 (SOTA) アルゴリズム パフォーマンスのベンチマークも提供し、マルチ LiDAR システムを使用した協働ロボット ワークスペースのリアルタイム セマンティック セグメンテーションを示します。
リアルタイムで動的に変化する状況で訓練されたディープ ネットワークを使用した有望な結果は、私たちが正しい方向に進んでいることを示しています。
私たちの知覚パイプラインは、8Hz のスループットを維持しながら、$>$96\% の予測ポイント精度と $>$92\% の平均交差オーバー ユニオン (mIOU) で 20Hz のスループットを達成します。

要約(オリジナル)

Safe human-robot collaboration (HRC) has recently gained a lot of interest with the emerging Industry 5.0 paradigm. Conventional robots are being replaced with more intelligent and flexible collaborative robots (cobots). Safe and efficient collaboration between cobots and humans largely relies on the cobot’s comprehensive semantic understanding of the dynamic surrounding of industrial environments. Despite the importance of semantic understanding for such applications, 3D semantic segmentation of collaborative robot workspaces lacks sufficient research and dedicated datasets. The performance limitation caused by insufficient datasets is called ‘data hunger’ problem. To overcome this current limitation, this work develops a new dataset specifically designed for this use case, named ‘COVERED’, which includes point-wise annotated point clouds of a robotic cell. Lastly, we also provide a benchmark of current state-of-the-art (SOTA) algorithm performance on the dataset and demonstrate a real-time semantic segmentation of a collaborative robot workspace using a multi-LiDAR system. The promising results from using the trained Deep Networks on a real-time dynamically changing situation shows that we are on the right track. Our perception pipeline achieves 20Hz throughput with a prediction point accuracy of $>$96\% and $>$92\% mean intersection over union (mIOU) while maintaining an 8Hz throughput.

arxiv情報

著者 Charith Munasinghe,Fatemeh Mohammadi Amin,Davide Scaramuzza,Hans Wernher van de Venn
発行日 2023-02-24 14:24:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク