Fast and Accurate Unknown Object Instance Segmentation through Error-Informed Refinement

要約

未知の物体を正確に認識することは、特に構造化されていない環境で新しいアイテムを操作する場合、自律ロボットにとって不可欠です。
しかし、既存の未知オブジェクト インスタンス セグメンテーション (UOIS) 手法には、過剰セグメンテーションや過小セグメンテーションの問題が頻繁にあり、その結果、インスタンスの境界が不正確になり、把握や配置などの後続のロボット タスクで障害が発生します。
この課題に対処するために、この記事では、UOIS のパフォーマンスを向上させる、モデルに依存しない高速かつ正確な改良手法である INSTA-BEER を紹介します。
このモデルは、最初のセグメンテーションでピクセルごとのエラーを予測し、次にこれらの誤差推定値に基づいてセグメンテーションを洗練する、エラー情報に基づいたリファインメント アプローチを採用しています。
クアッドメトリック境界誤差を導入します。これは、オブジェクト インスタンスの境界におけるピクセル単位の真陽性、真陰性、偽陽性、および偽陰性を定量化し、粒度の細かいセグメンテーション エラーとインスタンス レベルのセグメンテーション エラーの両方を効果的に捕捉します。
さらに、Error Guide Fusion (EGF) モジュールは、エラー情報をリファインメント プロセスに明示的に統合し、セグメンテーションの品質をさらに向上させます。
広く使用されている 3 つのベンチマーク データセットに対して行われた包括的な評価では、INSTA-BEER は精度と推論時間の両方で最先端のモデルを上回りました。
さらに、現実世界のロボット実験により、雑然とした環境での対象物把握タスクのパフォーマンスを向上させる際の本手法の実際的な適用可能性が実証されました。

要約(オリジナル)

Accurate perception of unknown objects is essential for autonomous robots, particularly when manipulating novel items in unstructured environments. However, existing unknown object instance segmentation (UOIS) methods often have over-segmentation and under-segmentation problems, resulting in inaccurate instance boundaries and failures in subsequent robotic tasks such as grasping and placement. To address this challenge, this article introduces INSTA-BEER, a fast and accurate model-agnostic refinement method that enhances the UOIS performance. The model adopts an error-informed refinement approach, which first predicts pixel-wise errors in the initial segmentation and then refines the segmentation guided by these error estimates. We introduce the quad-metric boundary error, which quantifies pixel-wise true positives, true negatives, false positives, and false negatives at the boundaries of object instances, effectively capturing both fine-grained and instance-level segmentation errors. Additionally, the Error Guidance Fusion (EGF) module explicitly integrates error information into the refinement process, further improving segmentation quality. In comprehensive evaluations conducted on three widely used benchmark datasets, INSTA-BEER outperformed state-of-the-art models in both accuracy and inference time. Moreover, a real-world robotic experiment demonstrated the practical applicability of our method in improving the performance of target object grasping tasks in cluttered environments.

arxiv情報

著者 Seunghyeok Back,Sangbeom Lee,Kangmin Kim,Joosoon Lee,Sungho Shin,Jemo Maeng,Kyoobin Lee
発行日 2024-04-30 14:37:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク