DUFormer: A Novel Architecture for Power Line Segmentation of Aerial Images

要約

タイトル:空中画像の電力線セグメンテーションのための新しいアーキテクチャ、DUFormer

要約:

– 無人航空機(UAV)が低高度で運用されると、電力線は重大な安全上の脅威となる。しかし、空中画像から電力線を検出することは、前景データ(つまり、電力線)の小さなサイズと背景情報の豊富さのために困難である。
– この課題に対処するために、我々はDUFormerという言語的セグメンテーションアルゴリズムを提案する。このアルゴリズムは、空中画像で電力線を検出するために特別に設計されたものである。
– 提案手法では、強い帰納バイアスを持つ畳み込みニューラルネットワーク(CNN)による十分な特徴抽出がTransformerモデルの効率的な訓練に役立つと仮定している。このため、我々は、重なり合う特徴の再採掘とトークン化を担う重いトークンエンコーダを提供している。エンコーダは、ピラミッドCNN特徴抽出モジュールと電力線特徴強化モジュールで構成される。
– 電力線用の十分な特徴抽出の後、特徴融合が行われ、その後、Transformerブロックがグローバルモデリングに使用される。最終的なセグメンテーション結果は、復号化ヘッドでローカルとグローバルの特徴を融合して得られる。
– さらに、我々は多重重量損失関数の共同重要性を電力線セグメンテーションで示している。実験結果は、提案手法が公開されているTTPLAデータセットの電力線セグメンテーションで最新のパフォーマンスを達成していることを示している。

要約(オリジナル)

Power lines pose a significant safety threat to unmanned aerial vehicles (UAVs) operating at low altitudes. However, detecting power lines in aerial images is challenging due to the small size of the foreground data (i.e., power lines) and the abundance of background information. To address this challenge, we propose DUFormer, a semantic segmentation algorithm designed specifically for power line detection in aerial images. We assume that performing sufficient feature extraction with a convolutional neural network (CNN) that has a strong inductive bias is beneficial for training an efficient Transformer model. To this end, we propose a heavy token encoder responsible for overlapping feature re-mining and tokenization. The encoder comprises a pyramid CNN feature extraction module and a power line feature enhancement module. Following sufficient feature extraction for power lines, the feature fusion is carried out, and then the Transformer block is used for global modeling. The final segmentation result is obtained by fusing local and global features in the decode head. Additionally, we demonstrate the significance of the joint multi-weight loss function in power line segmentation. The experimental results demonstrate that our proposed method achieves the state-of-the-art performance in power line segmentation on the publicly available TTPLA dataset.

arxiv情報

著者 Deyu An,Qiang Zhang,Jianshu Chao,Ting Li,Feng Qiao,Yong Deng,Zhenpeng Bian,Jia Xu
発行日 2023-04-12 12:59:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク