Towards a mathematical theory of trajectory inference

要約

タイトル:軌跡推定の数学的理論に向けて

要約:
– 時間的マージナルのサンプルからランダムプロセスの軌跡を推定するための理論的枠組みと数値的手法を開発
– この問題は、細胞の状態を高次元で測定するものの、細胞の軌跡を時間的に追跡することができないシングルセルRNAシーケンシングデータの解析において生じる
– あるクラスのランダムプロセスについて、各時間点での時間的マージナルの限られたサンプルから真の軌跡を回復可能であることを証明し、実践的な効率的なアルゴリズムを提供する
– 開発した手法であるGlobal Waddington-OT(gWOT)は、全時間点にわたって総合的に提起されたエントロピー正則化最適輸送による滑らかな凸最適化問題に簡約化される
– 合成および実世界のデータセットにおいて効率的に問題が解決され、良い再構成が得られることを示す。

要約(オリジナル)

We devise a theoretical framework and a numerical method to infer trajectories of a stochastic process from samples of its temporal marginals. This problem arises in the analysis of single cell RNA-sequencing data, which provide high dimensional measurements of cell states but cannot track the trajectories of the cells over time. We prove that for a class of stochastic processes it is possible to recover the ground truth trajectories from limited samples of the temporal marginals at each time-point, and provide an efficient algorithm to do so in practice. The method we develop, Global Waddington-OT (gWOT), boils down to a smooth convex optimization problem posed globally over all time-points involving entropy-regularized optimal transport. We demonstrate that this problem can be solved efficiently in practice and yields good reconstructions, as we show on several synthetic and real datasets.

arxiv情報

著者 Hugo Lavenant,Stephen Zhang,Young-Heon Kim,Geoffrey Schiebinger
発行日 2023-04-03 15:18:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: 49M29, 62M20 (Primary) 62G99, 92C15 (Secondary), cs.LG, math.OC, math.PR, math.ST, stat.ML, stat.TH パーマリンク