要約
我々は、階層的クラスタリング手法を単一細胞 RNA シーケンス データに拡張する、単一細胞ツリー変分オートエンコーダー用の新しい方法 scTree を提案します。
scTree はバッチ効果を修正すると同時に、ツリー構造のデータ表現を学習します。
この VAE ベースの方法により、バッチのバイアス効果とは無関係に、複雑な細胞の状況をより深く理解することができます。
7 つのデータセットで、scTree がデータの基礎となるクラスターとそれらの間の階層関係を発見し、これらのデータセット全体で確立されたベースライン手法を上回るパフォーマンスを示すことを経験的に示します。
さらに、学習した階層を分析してその生物学的関連性を理解することで、バッチ補正をクラスタリング手順に直接統合することの重要性を裏付けています。
要約(オリジナル)
We propose a novel method, scTree, for single-cell Tree Variational Autoencoders, extending a hierarchical clustering approach to single-cell RNA sequencing data. scTree corrects for batch effects while simultaneously learning a tree-structured data representation. This VAE-based method allows for a more in-depth understanding of complex cellular landscapes independently of the biasing effects of batches. We show empirically on seven datasets that scTree discovers the underlying clusters of the data and the hierarchical relations between them, as well as outperforms established baseline methods across these datasets. Additionally, we analyze the learned hierarchy to understand its biological relevance, thus underpinning the importance of integrating batch correction directly into the clustering procedure.
arxiv情報
著者 | Moritz Vandenhirtz,Florian Barkmann,Laura Manduchi,Julia E. Vogt,Valentina Boeva |
発行日 | 2024-06-27 16:16:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google