Fast and Precise Binary Instance Segmentation of 2D Objects for Automotive Applications

要約

このホワイト ペーパーでは、人間がグラウンド トゥルース データセットをポリゴンでラベル付けするのを支援するために、バイナリ 2D インスタンス セグメンテーションの改善に焦点を当てます。
ラベラーはオブジェクトの周りにボックスを描くだけで、ポリゴンが自動的に生成されます。
有用であるためには、私たちのシステムはリアルタイムで CPU 上で実行する必要があります。
バイナリ インスタンス セグメンテーションの最も一般的なアプローチには、エンコーダー デコーダー ネットワークが含まれます。
このレポートでは、最先端のエンコーダー/デコーダー ネットワークを評価し、これらのネットワークを使用してインスタンス セグメンテーションの品質を向上させる方法を提案します。
ネットワークアーキテクチャの改善に加えて、提案された方法は、ネットワーク入力に追加の情報を提供することに依存しています。これは、いわゆる極端なポイント、つまりオブジェクトシルエットの最も外側のポイントです。
ユーザーは、バウンディング ボックスの代わりにラベルを付けることができます。
境界ボックスは、極値からも推定できます。
この方法は、他の最先端のエンコーダー/デコーダー ネットワークと比較して優れた IoU を生成し、CPU にデプロイされた場合でも十分に高速に実行されます。

要約(オリジナル)

In this paper, we focus on improving binary 2D instance segmentation to assist humans in labeling ground truth datasets with polygons. Humans labeler just have to draw boxes around objects, and polygons are generated automatically. To be useful, our system has to run on CPUs in real-time. The most usual approach for binary instance segmentation involves encoder-decoder networks. This report evaluates state-of-the-art encoder-decoder networks and proposes a method for improving instance segmentation quality using these networks. Alongside network architecture improvements, our proposed method relies upon providing extra information to the network input, so-called extreme points, i.e. the outermost points on the object silhouette. The user can label them instead of a bounding box almost as quickly. The bounding box can be deduced from the extreme points as well. This method produces better IoU compared to other state-of-the-art encoder-decoder networks and also runs fast enough when it is deployed on a CPU.

arxiv情報

著者 Darshan Ganganna Ravindra,Laslo Dinges,Al-Hamadi Ayoub,Vasili Baranau
発行日 2022-08-24 13:19:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク