要約
近年の航空画像へのアクセスと量の増加、計算能力の向上、およびアプリケーションへの関心により、物体検出と領域適応の研究を実運用にスケールアップする道が開かれた。航空データセットはサイズが非常に大きく、データセットの各フレームには膨大な数の密なオブジェクトと小さなオブジェクトが含まれています。航空画像のディープラーニングアプリケーションは、トレーニングデータの不足により遅れており、研究者は最近、この問題を軽減するために、ラベル付きデータセットからラベルなしデータセットへの領域適応(DA)に着目しています。これらの要因は、データセット間の高い多様性(例えば、オブジェクトサイズ、クラス分布、オブジェクト特徴の均一性、画像取得、距離、気象条件)、および衛星画像中のオブジェクトのサイズとそれに続く最新技術では衛星画像中の小さなオブジェクト、局所特徴、および密に重なったオブジェクトに対する領域提案を捉えることができない、という2つの大きな課題を生み出している。本論文では、これらの問題に対する解決策として、ドメイン間の局所特徴空間をより良く整合させるドメイン識別器と、空間ピラミッドプーリング、クロスステージ部分ネットワーク、ヒートマップに基づく領域提案による領域提案ネットワーク、画像の困難性に基づいて全体の焦点損失尺度を適応する新しい画像困難スコアによる物体位置特定と特定によってバックエンドを改善する新規パイプラインを提案している。提案モデルは、最先端手法よりも7.4%性能が優れている。
要約(オリジナル)
Recent increases in aerial image access and volume, increases in computational power, and interest in applications have opened the door to scaling up object detection and domain adaptation research to production. Aerial data sets are very large in size, and each frame of the data set contains a huge number of dense and small objects. Deep learning applications for aerial imagery are behind due to a lack of training data, and researchers have recently turned to domain adaptation (DA) from a labeled data set to an unlabeled data set to alleviate the issue. These factors create two major challenges: the high variety between datasets (e.g. object sizes, class distributions, object feature uniformity, image acquisition, distance, weather conditions), and the size of objects in satellite imagery and subsequent failure of state-of-the-art to capture small objects, local features, and region proposals for densely overlapped objects in satellite image. In this paper, we propose two solutions to these problems: a domain discriminator to better align the local feature space between domains; and a novel pipeline that improves the back-end by spatial pyramid pooling, cross-stage partial network, region proposal network via heatmap-based region proposals, and object localization and identification through a novel image difficulty score that adapts the overall focal loss measure based on the image difficulty. Our proposed model outperformed the state-of-the-art method by 7.4%.
arxiv情報
著者 | Debojyoti Biswas,Jelena Tešić |
発行日 | 2022-09-06 15:16:35+00:00 |
arxivサイト | arxiv_id(pdf) |