要約
MALDI データから固有の情報を取得し、それを変換してデータのトポロジー永続性を反映する新しい代数的トポロジー フレームワークを提案します。
私たちのフレームワークには、主に 2 つの利点があります。
まず、トポロジーの永続性は、信号とノイズを区別するのに役立ちます。
第 2 に、MALDI データを圧縮することで、ストレージ スペースを節約し、さらなる分類タスクの計算時間を最適化します。
トポロジー フレームワークを実行し、単一の調整パラメーターに依存するアルゴリズムを導入します。
さらに、計算効率が高いことを示します。
永続性抽出に続いて、結果として得られる永続性変換図に基づいてロジスティック回帰とランダム フォレスト分類器が実行され、観測単位がバイナリ クラス ラベルに分類され、肺がんのサブタイプが記述されます。
さらに、提案されたフレームワークを実世界の MALDI データ セットで利用し、方法の競合性を相互検証によって示します。
要約(オリジナル)
We propose a new algebraic topological framework, which obtains intrinsic information from the MALDI data and transforms it to reflect topological persistence in the data. Our framework has two main advantages. First, the topological persistence helps us to distinguish the signal from noise. Second, it compresses the MALDI data, which results in saving storage space, and also optimizes the computational time for further classification tasks. We introduce an algorithm that performs our topological framework and depends on a single tuning parameter. Furthermore, we show that it is computationally efficient. Following the persistence extraction, logistic regression and random forest classifiers are executed based on the resulting persistence transformation diagrams to classify the observational units into binary class labels, describing the lung cancer subtypes. Further, we utilized the proposed framework in a real-world MALDI data set, and the competitiveness of the methods is illustrated via cross-validation.
arxiv情報
著者 | Gideon Klaila,Vladimir Vutov,Anastasios Stefanou |
発行日 | 2023-02-27 16:49:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google