Spatial Transcriptomics Analysis of Zero-shot Gene Expression Prediction

要約

空間トランスクリプトミクス (ST) は、組織スライドの異なる領域 (つまり、ウィンドウ) 内の遺伝子発現を捕捉します。
モデル ST に適用される従来の教師あり学習フレームワークは、トレーニング中に見られる遺伝子タイプのスライド画像ウィンドウから発現を予測することに制約されており、目に見えない遺伝子タイプに一般化することができません。
この制限を克服するために、スライド画像ウィンドウから遺伝子発現を予測するための先駆的なゼロショット フレームワークであるセマンティック ガイド ネットワーク (SGN) を提案します。
遺伝子型は機能性と表現型によって記述できると考え、遺伝子型をその機能性と表現型ごとにベクターに動的に埋め込み、このベクターを使用してスライド画像ウィンドウを特徴空間の遺伝子発現に投影し、ゼロショット発現予測を可能にします。
目に見えない遺伝子の種類。
遺伝子型の機能と表現型は、事前にトレーニングされた大規模言語モデル (LLM) から慎重に設計されたプロンプトを使用して照会されます。
標準ベンチマーク データセットでは、過去の最先端の教師あり学習アプローチと比較して、競争力のあるゼロショット パフォーマンスを実証しました。

要約(オリジナル)

Spatial transcriptomics (ST) captures gene expression within distinct regions (i.e., windows) of a tissue slide. Traditional supervised learning frameworks applied to model ST are constrained to predicting expression from slide image windows for gene types seen during training, failing to generalize to unseen gene types. To overcome this limitation, we propose a semantic guided network (SGN), a pioneering zero-shot framework for predicting gene expression from slide image windows. Considering a gene type can be described by functionality and phenotype, we dynamically embed a gene type to a vector per its functionality and phenotype, and employ this vector to project slide image windows to gene expression in feature space, unleashing zero-shot expression prediction for unseen gene types. The gene type functionality and phenotype are queried with a carefully designed prompt from a pre-trained large language model (LLM). On standard benchmark datasets, we demonstrate competitive zero-shot performance compared to past state-of-the-art supervised learning approaches.

arxiv情報

著者 Yan Yang,Md Zakir Hossain,Xuesong Li,Shafin Rahman,Eric Stone
発行日 2024-01-26 10:53:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク