要約
人工知能の手法は、大規模な天文データセットの作業の品質と速度を向上させる上で大きな期待を寄せていますが、これらの手法は非常に複雑であるため、データセット固有の堅牢でない特徴の抽出につながります。
したがって、そのような方法は、複数のデータセットにわたってうまく一般化できません。
この課題を克服するためのアプローチとして、ユニバーサル ドメイン適応法 \textit{DeepAstroUDA} を提示します。
このアルゴリズムは、半教師付きドメイン適応を実行し、異なるデータ分布とクラスの重複を持つデータセットに適用できます。
重複しないクラスは、2 つのデータセット (ラベル付けされたソース ドメイン、またはラベル付けされていないターゲット ドメイン) のいずれにも存在する可能性があり、未知のクラスが存在する場合でもメソッドを使用できます。
異常検出を伴う、複雑さの異なる銀河の形態分類タスクの 3 つの例 ($3$ クラスおよび $10$ クラスの問題) にこの方法を適用します。
$1$ および $10$ 年の観測);
2) 異なる調査 (SDSS および DECaLS) からのデータ。
3) 1 回の調査内で深さの異なるフィールドを観測したデータ (ワイド フィールドと SDSS の Stripe 82 ディープ フィールド)。
初めて、非常に矛盾した観測データセット間のドメイン適応の使用が成功したことを示します。
\textit{DeepAstroUDA} は、2 つの天文調査の間のギャップを埋め、両方のドメインで分類精度を向上させ (ラベルのないデータで最大 $40\%$)、データセット全体でモデルのパフォーマンスを一貫させることができます。
さらに、私たちの方法は異常検出アルゴリズムとしてもうまく機能し、ラベル付けされていないターゲット データセットであっても、未知のクラス サンプルを正常にクラスター化します。
要約(オリジナル)
Artificial intelligence methods show great promise in increasing the quality and speed of work with large astronomical datasets, but the high complexity of these methods leads to the extraction of dataset-specific, non-robust features. Therefore, such methods do not generalize well across multiple datasets. We present a universal domain adaptation method, \textit{DeepAstroUDA}, as an approach to overcome this challenge. This algorithm performs semi-supervised domain adaptation and can be applied to datasets with different data distributions and class overlaps. Non-overlapping classes can be present in any of the two datasets (the labeled source domain, or the unlabeled target domain), and the method can even be used in the presence of unknown classes. We apply our method to three examples of galaxy morphology classification tasks of different complexities ($3$-class and $10$-class problems), with anomaly detection: 1) datasets created after different numbers of observing years from a single survey (LSST mock data of $1$ and $10$ years of observations); 2) data from different surveys (SDSS and DECaLS); and 3) data from observing fields with different depths within one survey (wide field and Stripe 82 deep field of SDSS). For the first time, we demonstrate the successful use of domain adaptation between very discrepant observational datasets. \textit{DeepAstroUDA} is capable of bridging the gap between two astronomical surveys, increasing classification accuracy in both domains (up to $40\%$ on the unlabeled data), and making model performance consistent across datasets. Furthermore, our method also performs well as an anomaly detection algorithm and successfully clusters unknown class samples even in the unlabeled target dataset.
arxiv情報
著者 | A. Ćiprijanović,A. Lewis,K. Pedro,S. Madireddy,B. Nord,G. N. Perdue,S. M. Wild |
発行日 | 2023-03-22 17:03:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google