Practical Galaxy Morphology Tools from Deep Supervised Representation Learning

要約

天文学者は通常、ゼロから独自の表現を作成することによって、教師付き機械学習の問題を解決することに着手しています。我々は、Galaxy Zoo DECaLSのすべての質問に答えるために訓練された深層学習モデルが、モデルが訓練されなかった新しいタスクに有用な銀河の意味的な表現を学習することを示す。我々はこれらの表現を利用し、大規模な銀河のサンプルを調査するために重要な実用的なタスクにおいて、最近のいくつかのアプローチを凌駕することができました。最初のタスクは、問い合わせ銀河と類似の形態を持つ銀河を特定することです。人間によってフリーテキストのタグが付けられた銀河が一つあるとすると(例えば「#diffuse」)、ほとんどのタグについてそのタグに一致する銀河を見つけることができます。第二のタスクは、特定の研究者にとって最も興味深い異常の特定です。我々のアプローチは、最も興味深い100個の異常を100%の精度で特定することができます(Galaxy Zoo 2のボランティアによって判断されます)。3つ目の課題は、新たにラベル付けされた少数の銀河だけを用いて、新しい課題を解決するためにモデルを適応させることです。我々の表現から微調整したモデルは、地上画像(ImageNet)から微調整したモデルやゼロから学習したモデルよりも、リング銀河を識別する能力に優れています。我々は、1つのラベル(類似性検索)または数百のラベル(異常検出または微調整)を使って各課題を解決しています。これは、深い教師ありの手法は天文学で実用化するために新しい大規模なラベル付きデータセットを必要とするという、長年の見解に挑戦するものである。私たちの事前学習済みモデルをコミュニティが利用できるように、私たちは微調整コードZoobotを公開しています。Zoobotは、深層学習の経験がない研究者でも利用することができます。

要約(オリジナル)

Astronomers have typically set out to solve supervised machine learning problems by creating their own representations from scratch. We show that deep learning models trained to answer every Galaxy Zoo DECaLS question learn meaningful semantic representations of galaxies that are useful for new tasks on which the models were never trained. We exploit these representations to outperform several recent approaches at practical tasks crucial for investigating large galaxy samples. The first task is identifying galaxies of similar morphology to a query galaxy. Given a single galaxy assigned a free text tag by humans (e.g. ‘#diffuse’), we can find galaxies matching that tag for most tags. The second task is identifying the most interesting anomalies to a particular researcher. Our approach is 100% accurate at identifying the most interesting 100 anomalies (as judged by Galaxy Zoo 2 volunteers). The third task is adapting a model to solve a new task using only a small number of newly-labelled galaxies. Models fine-tuned from our representation are better able to identify ring galaxies than models fine-tuned from terrestrial images (ImageNet) or trained from scratch. We solve each task with very few new labels; either one (for the similarity search) or several hundred (for anomaly detection or fine-tuning). This challenges the longstanding view that deep supervised methods require new large labelled datasets for practical use in astronomy. To help the community benefit from our pretrained models, we release our fine-tuning code Zoobot. Zoobot is accessible to researchers with no prior experience in deep learning.

arxiv情報

著者 Mike Walmsley,Anna M. M. Scaife,Chris Lintott,Michelle Lochner,Verlon Etsebeth,Tobias Géron,Hugh Dickinson,Lucy Fortson,Sandor Kruk,Karen L. Masters,Kameswara Bharadwaj Mantha,Brooke D. Simmons
発行日 2022-06-08 10:57:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: astro-ph.GA, cs.CV パーマリンク