Unsupervised Machine Learning for the Classification of Astrophysical X-ray Sources

要約

X 線検出の自動分類は、天体物理源の編集されたカタログから天体物理情報を抽出するために必要なステップです。
分類は、個々のオブジェクトの研究、集団研究の統計、さらに異常検出、つまり、過渡現象やスペクトルの極端な発生源を含む新しい未調査の現象の特定に役立ちます。
このタスクの重要性にもかかわらず、X 線天文学では、対応する光学部品や代表的なトレーニング セットが不足しているため、分類は依然として困難です。
私たちは、限定された数のラベル付きソースを使用し、光学カタログや赤外線カタログからの補助情報を使用せずに、チャンドラ ソース カタログ ソースに確率的クラスを提供する教師なし機械学習アプローチを採用する代替方法論を開発します。
我々は、合計 14,507 個の検出を含む 8,756 個のソースの確率クラスのカタログを提供し、この方法が若い恒星天体からの発光を特定すること、および有意な影響を伴う小規模と大規模なコンパクト降散器を区別することに成功したことを実証します。
自信のレベル。
私たちは、分類された天体間の特徴の分布と、統合 AGN モデルなどの十分に確立された天体物理学的仮説との間の一貫性を調査します。
これにより、確率的分類器に解釈可能性が提供されます。
コードとテーブルは GitHub を通じて公開されています。
https://umlcaxs-playground.streamlit.app では、読者が最終的な分類を探索できる Web プレイグラウンドを提供しています。

要約(オリジナル)

The automatic classification of X-ray detections is a necessary step in extracting astrophysical information from compiled catalogs of astrophysical sources. Classification is useful for the study of individual objects, statistics for population studies, as well as for anomaly detection, i.e., the identification of new unexplored phenomena, including transients and spectrally extreme sources. Despite the importance of this task, classification remains challenging in X-ray astronomy due to the lack of optical counterparts and representative training sets. We develop an alternative methodology that employs an unsupervised machine learning approach to provide probabilistic classes to Chandra Source Catalog sources with a limited number of labeled sources, and without ancillary information from optical and infrared catalogs. We provide a catalog of probabilistic classes for 8,756 sources, comprising a total of 14,507 detections, and demonstrate the success of the method at identifying emission from young stellar objects, as well as distinguishing between small-scale and large-scale compact accretors with a significant level of confidence. We investigate the consistency between the distribution of features among classified objects and well-established astrophysical hypotheses such as the unified AGN model. This provides interpretability to the probabilistic classifier. Code and tables are available publicly through GitHub. We provide a web playground for readers to explore our final classification at https://umlcaxs-playground.streamlit.app.

arxiv情報

著者 Víctor Samuel Pérez-Díaz,Juan Rafael Martínez-Galarza,Alexander Caicedo,Raffaele D’Abrusco
発行日 2024-01-22 18:42:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: astro-ph.IM, cs.AI パーマリンク