Boundary Attention: Learning curves, corners, junctions and grouping

要約

曲線、コーナー、ジャンクションなどのグループ化と境界を推測する軽量ネットワークを紹介します。
これは、サブピクセルのエッジ位置特定とエッジリンキングの古典的な方法に似たボトムアップ方式で動作しますが、ローカル境界構造の高次元表現と、設計ではなく学習されるローカルスケールと空間的一貫性の概念を使用します。

私たちのネットワークは、境界アテンションと呼ばれるメカニズムを使用しています。これは、ジオメトリを意識したローカル アテンション操作であり、高密度かつ繰り返し適用されると、画像内で重なり合うすべてのパッチの境界構造を指定する変数のピクセル解像度フィールドが徐々に洗練されます。
ラスター化されたバイナリ エッジ マップを生成する多くのエッジ検出器とは異なり、私たちのモデルは、すべての局所領域の幾何学的構造のラスター化されていない豊富な表現を提供します。
その意図的な幾何学的バイアスにより、単純な合成形状でトレーニングし、ノイズの多い低照度の写真から境界を抽出するように一般化できることがわかりました。

要約(オリジナル)

We present a lightweight network that infers grouping and boundaries, including curves, corners and junctions. It operates in a bottom-up fashion, analogous to classical methods for sub-pixel edge localization and edge-linking, but with a higher-dimensional representation of local boundary structure, and notions of local scale and spatial consistency that are learned instead of designed. Our network uses a mechanism that we call boundary attention: a geometry-aware local attention operation that, when applied densely and repeatedly, progressively refines a pixel-resolution field of variables that specify the boundary structure in every overlapping patch within an image. Unlike many edge detectors that produce rasterized binary edge maps, our model provides a rich, unrasterized representation of the geometric structure in every local region. We find that its intentional geometric bias allows it to be trained on simple synthetic shapes and then generalize to extracting boundaries from noisy low-light photographs.

arxiv情報

著者 Mia Gaia Polansky,Charles Herrmann,Junhwa Hur,Deqing Sun,Dor Verbin,Todd Zickler
発行日 2024-09-16 17:42:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク