Morphological Classification of Extragalactic Radio Sources Using Gradient Boosting Methods



– 最近の新しい無線望遠鏡によるデータ量の増加により、無線天文学の分野では毎日膨大なデータが生成されている。そのうちの1つの最も重要な問題は、外銀河放射源の形態に基づいた自動分類である。
– 近年の外銀河放射源の形態分類の分野での最新の貢献は、畳み込みニューラルネットワークをベースとした分類器を提案している。
– この研究では、主成分分析に伴う勾配ブースティング機械学習方法を、畳み込みニューラルネットワークのデータ効率的な代替手段として提案している。勾配ブースティング法が表形式データの分類問題で深層学習法を上回ることが示されている。
– この研究で考慮された勾配ブースティング法は、XGBoost、LightGBM、CatBoostの実装に基づくものである。
– 外銀河放射源の形態に基づいた3つのグループによる3つのクラス分類問題を、Best-Heckmanサンプルの無線源を使用して考慮している。
– すべての提案された勾配ブースティング法は、最新の畳み込みニューラルネットワークベースの分類器よりも高精度で、イメージの数の4分の1未満を使用している。また、CatBoostが最も高い正確性を持っている。
– これは、勾配ブースティング法がFanaroff-RileyクラスIIの源の分類において優れた精度を持っているためである。


The field of radio astronomy is witnessing a boom in the amount of data produced per day due to newly commissioned radio telescopes. One of the most crucial problems in this field is the automatic classification of extragalactic radio sources based on their morphologies. Most recent contributions in the field of morphological classification of extragalactic radio sources have proposed classifiers based on convolutional neural networks. Alternatively, this work proposes gradient boosting machine learning methods accompanied by principal component analysis as data-efficient alternatives to convolutional neural networks. Recent findings have shown the efficacy of gradient boosting methods in outperforming deep learning methods for classification problems with tabular data. The gradient boosting methods considered in this work are based on the XGBoost, LightGBM, and CatBoost implementations. This work also studies the effect of dataset size on classifier performance. A three-class classification problem is considered in this work based on the three main Fanaroff-Riley classes: class 0, class I, and class II, using radio sources from the Best-Heckman sample. All three proposed gradient boosting methods outperformed a state-of-the-art convolutional neural networks-based classifier using less than a quarter of the number of images, with CatBoost having the highest accuracy. This was mainly due to the superior accuracy of gradient boosting methods in classifying Fanaroff-Riley class II sources, with 3–4\% higher recall.


著者 Abdollah Masoud Darya,Ilias Fernini,Marley Vellasco,Abir Hussain
発行日 2023-04-25 11:19:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: astro-ph.IM, cs.LG パーマリンク