Benchmarking and optimizing organism wide single-cell RNA alignment methods

要約

バッチ効果を削除し、シングルセルRNA(SCRNA)データセットを調整するための多くの方法が提案されています。
ただし、パフォーマンスは通常、複数のパラメーターと少数のデータセットに基づいて評価され、大規模なデータを調整するのに最適な方法を評価する際の課題を生み出します。
ここでは、k-neighbors交差点(KNI)スコアを導入します。これは、クロスダタセットセルタイプのラベル予測でバッチ効果と測定の精度を測定する単一スコアを導入します。
KNIスコアを使用して、クロスダタセットシングルセルRNA統合のアプローチを評価および最適化します。
バッチ敵対的なシングルセル変異推論(BA-SCVI)を導入します。SCVIの新しいバリアントとして、敵対的なトレーニングを使用してエンコーダーとデコーダーのバッチ効果を罰し、このアプローチが他の方法を上回ることを示しています。
結果として整列した空間では、細胞型グループの粒度が保存されていることがわかり、情報を失うことなく単一のモデルによって全生物細胞型マップを作成できるという概念を支持します。

要約(オリジナル)

Many methods have been proposed for removing batch effects and aligning single-cell RNA (scRNA) datasets. However, performance is typically evaluated based on multiple parameters and few datasets, creating challenges in assessing which method is best for aligning data at scale. Here, we introduce the K-Neighbors Intersection (KNI) score, a single score that both penalizes batch effects and measures accuracy at cross-dataset cell-type label prediction alongside carefully curated small (scMARK) and large (scREF) benchmarks comprising 11 and 46 human scRNA studies respectively, where we have standardized author labels. Using the KNI score, we evaluate and optimize approaches for cross-dataset single-cell RNA integration. We introduce Batch Adversarial single-cell Variational Inference (BA-scVI), as a new variant of scVI that uses adversarial training to penalize batch-effects in the encoder and decoder, and show this approach outperforms other methods. In the resulting aligned space, we find that the granularity of cell-type groupings is conserved, supporting the notion that whole-organism cell-type maps can be created by a single model without loss of information.

arxiv情報

著者 Juan Javier Diaz-Mejia,Elias Williams,Octavian Focsa,Dylan Mendonca,Swechha Singh,Brendan Innes,Sam Cooper
発行日 2025-03-26 17:11:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク