要約
今日の重要な課題は、このようなマルチモーダルデータがシステム内の基礎となるプロセスのより包括的な概要を提供する可能性があるため、マルチオミクスデータを効率的に処理する機能にあります。
しかし、それには課題が伴います。マルチオミクスのデータはほとんどの場合、ほとんど対応しておらず、部分的にしかラベル付けされていません。さらに、まれな疾患などの状況では少量のデータのみが利用可能です。
これらの特定の設定を説明するための半監視されたアプローチである、小規模および対応のないデータセットのマルチオミクスデータ統合を略するModisを提案します。
Modisは、不均一なデータモダリティの確率的結合を学び、モダリティが整合される共有潜在空間を学習します。
人工データに依存して制御された実験を構築して、モダリティの正確な調整に必要な監督がどれだけ必要か、そして私たちのアプローチが利用可能なデータが少ない新しい条件に対処する方法を探求します。
このコードは、atttps://github.com/villoutreixlab/modisで利用できます。
要約(オリジナル)
A key challenge today lies in the ability to efficiently handle multi-omics data since such multimodal data may provide a more comprehensive overview of the underlying processes in a system. Yet it comes with challenges: multi-omics data are most often unpaired and only partially labeled, moreover only small amounts of data are available in some situation such as rare diseases. We propose MODIS which stands for Multi-Omics Data Integration for Small and unpaired datasets, a semi supervised approach to account for these particular settings. MODIS learns a probabilistic coupling of heterogeneous data modalities and learns a shared latent space where modalities are aligned. We rely on artificial data to build controlled experiments to explore how much supervision is needed for an accurate alignment of modalities, and how our approach enables dealing with new conditions for which few data are available. The code is available athttps://github.com/VILLOUTREIXLab/MODIS.
arxiv情報
著者 | Daniel Lepe-Soltero,Thierry Artières,Anaïs Baudot,Paul Villoutreix |
発行日 | 2025-03-24 16:33:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google