SpaRED benchmark: Enhancing Gene Expression Prediction from Histology Images with Spatial Transcriptomics Completion

要約

空間トランスクリプトミクスは、空間的に分解された遺伝子発現プロファイルと組織像を位置合わせする新しい技術です。
画期的ではありますが、遺伝子の捕捉に問題があり、取得したデータに大きな破損が生じます。
潜在的な応用を考慮して、最近の取り組みは、組織学画像のみからトランスクリプトームプロファイルを予測することに焦点を当てている。
ただし、データベース、前処理技術、トレーニング ハイパーパラメーターの違いにより、メソッド間の公平な比較が妨げられます。
これらの課題に対処するために、私たちは 26 の公的情報源から収集した体系的に精選および処理されたデータベースを提示します。これは、以前の研究と比較して 8.6 倍に増加しています。
さらに、欠落した遺伝子発現を推測するための最先端のトランスフォーマーベースの補完技術を提案します。これにより、すべてのデータセットにわたるトランスクリプトームプロファイル予測のパフォーマンスが大幅に向上します。
まとめると、私たちの貢献は、これまでの組織学画像からの遺伝子発現予測の最も包括的なベンチマークを構成し、空間トランスクリプトミクスに関する将来の研究への足がかりとなります。

要約(オリジナル)

Spatial Transcriptomics is a novel technology that aligns histology images with spatially resolved gene expression profiles. Although groundbreaking, it struggles with gene capture yielding high corruption in acquired data. Given potential applications, recent efforts have focused on predicting transcriptomic profiles solely from histology images. However, differences in databases, preprocessing techniques, and training hyperparameters hinder a fair comparison between methods. To address these challenges, we present a systematically curated and processed database collected from 26 public sources, representing an 8.6-fold increase compared to previous works. Additionally, we propose a state-of-the-art transformer based completion technique for inferring missing gene expression, which significantly boosts the performance of transcriptomic profile predictions across all datasets. Altogether, our contributions constitute the most comprehensive benchmark of gene expression prediction from histology images to date and a stepping stone for future research on spatial transcriptomics.

arxiv情報

著者 Gabriel Mejia,Daniela Ruiz,Paula Cárdenas,Leonardo Manrique,Daniela Vega,Pablo Arbeláez
発行日 2024-09-27 17:29:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク