Outlier galaxy images in the Dark Energy Survey and their identification with unsupervised machine learning




– ダークエネルギー調査は、非常に多くの銀河オブジェクトの画像データを収集することができます。
– 科学的に興味深い多くの異常オブジェクトが、これらのデータの中に隠れていると予想されます。
– しかし、騒音や飽和画像が存在するため、異常なオブジェクトを特定することは難しい課題です。
– 本研究は、ダークエネルギー調査の最初のデータリリースにおける異常オブジェクトの自動検出のための方法を適用します。
– 機械学習に基づく異常検出を使用することで、アルゴリズムはデータベース内の他のオブジェクトと視覚的に異なるオブジェクトを同定できます。
– アルゴリズムの重要な特徴は、偽陽性率を制御できることであり、実用的な異常検出に使用できます。
– アルゴリズムは、異常オブジェクトの検出に完全な精度を提供しませんが、データを大幅に削減し、実用的な異常検出を可能にします。
– たとえば、アルゴリズムを2百万以上のDES画像に適用して、トップ250のオブジェクトを選択することで、めずらしい銀河のコレクションが提供されます。これは、データの手動検査を使用して編集するには非常に時間がかかるでしょう。


The Dark Energy Survey is able to collect image data of an extremely large number of extragalactic objects, and it can be reasonably assumed that many unusual objects of high scientific interest are hidden inside these data. Due to the extreme size of DES data, identifying these objects among many millions of other celestial objects is a challenging task. The problem of outlier detection is further magnified by the presence of noisy or saturated images. When the number of tested objects is extremely high, even a small rate of noise or false positives leads to a very large number of false detections, making an automatic system impractical. This study applies an automatic method for automatic detection of outlier objects in the first data release of the Dark Energy Survey. By using machine learning-based outlier detection, the algorithm is able to identify objects that are visually different from the majority of the other objects in the database. An important feature of the algorithm is that it allows to control the false-positive rate, and therefore can be used for practical outlier detection. The algorithm does not provide perfect accuracy in the detection of outlier objects, but it reduces the data substantially to allow practical outlier detection. For instance, the selection of the top 250 objects after applying the algorithm to more than $2\cdot10^6$ DES images provides a collection of uncommon galaxies. Such collection would have been extremely time-consuming to compile by using manual inspection of the data.


著者 Lior Shamir
発行日 2023-05-02 18:39:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: astro-ph.GA, astro-ph.IM, cs.CV パーマリンク