GeneQuery: A General QA-based Framework for Spatial Gene Expression Predictions from Histology Images

要約

遺伝子発現プロファイリングは、分子機構についての深い洞察を提供しますが、時間と費用がかかる性質により、多くの場合、重大な課題が生じます。
対照的に、ホールスライドのヘマトキシリン・エオシン (H&E) 染色組織像は容易にアクセスでき、顕微鏡レベルで組織の構造と組成を詳細に検査することができます。
最近の進歩では、これらの組織学的画像を利用して、空間的に分解された遺伝子発現プロファイルを予測しています。
しかし、最先端の研究では、遺伝子発現予測を多出力回帰問題として扱っており、各遺伝子が独自の重みで独立して学習されるため、遺伝子間の共有依存性や共発現パターンを捉えることができません。
さらに、既存の研究では、トレーニング中に見られる遺伝子の遺伝子発現値しか予測できず、新しい未確認の遺伝子に一般化する能力が制限されています。
上記の制限に対処するために、この論文では、より汎用性と柔軟性を高めるために、質問応答 (QA) 方式でこの遺伝子発現予測タスクを解決することを目的とした GeneQuery を紹介します。
具体的には、GeneQuery は遺伝子関連のテキストをクエリとして、スライド全体の画像をコンテキストとして取得し、クエリされた遺伝子発現値を予測します。
このような変換により、GeneQuery は遺伝子確率変数を導入することで暗黙的に遺伝子分布を推定できます。
さらに、提案された GeneQuery は、画像間のパターンをキャプチャするスポット認識 GeneQuery と遺伝子間のパターンをキャプチャする遺伝子認識 GeneQuery の 2 つのアーキテクチャ実装で構成されます。
空間トランスクリプトミクス データセットに関する包括的な実験により、提案された GeneQuery が既知および未知の遺伝子に対して既存の最先端の方法よりも優れた性能を発揮することが示されました。
さらに多くの結果は、GeneQuery が組織構造を分析できる可能性があることを示しています。

要約(オリジナル)

Gene expression profiling provides profound insights into molecular mechanisms, but its time-consuming and costly nature often presents significant challenges. In contrast, whole-slide hematoxylin and eosin (H&E) stained histological images are readily accessible and allow for detailed examinations of tissue structure and composition at the microscopic level. Recent advancements have utilized these histological images to predict spatially resolved gene expression profiles. However, state-of-the-art works treat gene expression prediction as a multi-output regression problem, where each gene is learned independently with its own weights, failing to capture the shared dependencies and co-expression patterns between genes. Besides, existing works can only predict gene expression values for genes seen during training, limiting their ability to generalize to new, unseen genes. To address the above limitations, this paper presents GeneQuery, which aims to solve this gene expression prediction task in a question-answering (QA) manner for better generality and flexibility. Specifically, GeneQuery takes gene-related texts as queries and whole-slide images as contexts and then predicts the queried gene expression values. With such a transformation, GeneQuery can implicitly estimate the gene distribution by introducing the gene random variable. Besides, the proposed GeneQuery consists of two architecture implementations, i.e., spot-aware GeneQuery for capturing patterns between images and gene-aware GeneQuery for capturing patterns between genes. Comprehensive experiments on spatial transcriptomics datasets show that the proposed GeneQuery outperforms existing state-of-the-art methods on known and unseen genes. More results also demonstrate that GeneQuery can potentially analyze the tissue structure.

arxiv情報

著者 Ying Xiong,Linjing Liu,Yufei Cui,Shangyu Wu,Xue Liu,Antoni B. Chan,Chun Jason Xue
発行日 2024-11-27 14:33:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク