Unsupervised Domain Adaptation with Histogram-gated Image Translation for Delayered IC Image Analysis

要約

深層学習は、回路構造のセグメンテーションに畳み込みニューラル ネットワーク (CNN) を採用することで、困難な回路注釈タスクで大きな成功を収めました。
ディープ ラーニングのアプローチでは、優れたパフォーマンスを実現するために、手動で注釈を付けた大量のトレーニング データが必要です。これにより、特定のデータセットでトレーニングされたディープ ラーニング モデルが別のデータセットに適用されると、パフォーマンスが低下する可能性があります。
これは、回路注釈のドメイン シフト問題として一般に知られています。これは、異なる画像データセット間で分布が大きく異なる可能性があることに起因します。
異なる画像データセットは、異なるデバイスまたは単一のデバイス内の異なるレイヤーから取得できます。
ドメインシフトの問題に対処するために、ヒストグラムゲート画像変換(HGIT)を提案します。これは、特定のソースデータセットからターゲットデータセットのドメインに画像を変換する教師なしドメイン適応フレームワークであり、変換された画像をセグメンテーションネットワークのトレーニングに利用します。
具体的には、HGIT は敵対的生成ネットワーク (GAN) ベースの画像変換を実行し、データのキュレーションにヒストグラム統計を利用します。
実験は、3 つの異なるターゲット データセット (トレーニング用のラベルなし) に適合した単一のラベル付きソース データセットで実施され、各ターゲット データセットのセグメンテーション パフォーマンスが評価されました。
私たちの方法が、報告されているドメイン適応技術と比較して最高のパフォーマンスを達成し、完全に監視されたベンチマークにかなり近いことも実証しました。

要約(オリジナル)

Deep learning has achieved great success in the challenging circuit annotation task by employing Convolutional Neural Networks (CNN) for the segmentation of circuit structures. The deep learning approaches require a large amount of manually annotated training data to achieve a good performance, which could cause a degradation in performance if a deep learning model trained on a given dataset is applied to a different dataset. This is commonly known as the domain shift problem for circuit annotation, which stems from the possibly large variations in distribution across different image datasets. The different image datasets could be obtained from different devices or different layers within a single device. To address the domain shift problem, we propose Histogram-gated Image Translation (HGIT), an unsupervised domain adaptation framework which transforms images from a given source dataset to the domain of a target dataset, and utilize the transformed images for training a segmentation network. Specifically, our HGIT performs generative adversarial network (GAN)-based image translation and utilizes histogram statistics for data curation. Experiments were conducted on a single labeled source dataset adapted to three different target datasets (without labels for training) and the segmentation performance was evaluated for each target dataset. We have demonstrated that our method achieves the best performance compared to the reported domain adaptation techniques, and is also reasonably close to the fully supervised benchmark.

arxiv情報

著者 Yee-Yang Tee,Deruo Cheng,Chye-Soon Chee,Tong Lin,Yiqiong Shi,Bah-Hwee Gwee
発行日 2022-09-27 15:53:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク