CSSAM: U-net Network for Application and Segmentation of Welding Engineering Drawings

要約

重機の製造では、図面の特定の輪郭を分割し、板金を溶接用の縮尺に合わせて切断します。
現在、溶接マップの輪郭のセグメンテーションと抽出のほとんどは手動で行われています。
その効率は大幅に低下します。
したがって、溶接工学図面の U-net ベースの輪郭セグメンテーションおよび抽出方法を提案します。
設計図に必要な部品の輪郭を自動的に分割して打ち抜くことができるため、製造効率が大幅に向上します。
U-net には、エンコーダーとデコーダーの間のセマンティックの違いと空間位置の特徴情報を介してエンドツーエンドのマッピングを実装するエンコーダー/デコーダーが含まれています。
U-net は医療画像のセグメント化に優れていますが、溶接構造図データセットに関する広範な実験では、従来の U-Net アーキテクチャでは溶接工学図面のセグメント化が不十分であることが示されています。
したがって、新しいチャネル空間シーケンス注意モジュール (CSSAM) を設計し、従来の U-net を改善します。
同時に、垂直最大プーリングと平均水平プーリングが提案されています。
2 つの等しい畳み込みを介してプーリング操作を CSSAM モジュールに渡します。
プーリング前の出力と特徴はセマンティック クラスタリングによって融合されます。これは従来のジャンプ構造を置き換え、エンコーダーとデコーダーの間のセマンティック ギャップを効果的に狭め、それによって溶接工学図面のセグメンテーション パフォーマンスを向上させます。
vgg16 をバックボーン ネットワークとして使用します。
従来の U-net と比較して、私たちのネットワークはエンジニアリング図面データセットのセグメンテーションにおいて優れたパフォーマンスを発揮します。

要約(オリジナル)

Heavy equipment manufacturing splits specific contours in drawings and cuts sheet metal to scale for welding. Currently, most of the segmentation and extraction of weld map contours is achieved manually. Its efficiency is greatly reduced. Therefore, we propose a U-net-based contour segmentation and extraction method for welding engineering drawings. The contours of the parts required for engineering drawings can be automatically divided and blanked, which significantly improves manufacturing efficiency. U-net includes an encoder-decoder, which implements end-to-end mapping through semantic differences and spatial location feature information between the encoder and decoder. While U-net excels at segmenting medical images, our extensive experiments on the Welding Structural Diagram dataset show that the classic U-Net architecture falls short in segmenting welding engineering drawings. Therefore, we design a novel Channel Spatial Sequence Attention Module (CSSAM) and improve on the classic U-net. At the same time, vertical max pooling and average horizontal pooling are proposed. Pass the pooling operation through two equal convolutions into the CSSAM module. The output and the features before pooling are fused by semantic clustering, which replaces the traditional jump structure and effectively narrows the semantic gap between the encoder and the decoder, thereby improving the segmentation performance of welding engineering drawings. We use vgg16 as the backbone network. Compared with the classic U-net, our network has good performance in engineering drawing dataset segmentation.

arxiv情報

著者 Zhiwei Song,Hui Yao,Dan Tian,GaoHui Zhan
発行日 2022-09-28 13:49:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク