RiboGen: RNA Sequence and Structure Co-Generation with Equivariant MultiFlow

要約

リボ核酸(RNA)は、遺伝情報を運ぶことから酵素機能の実行まで、生物系で基本的な役割を果たします。
RNAの理解と設計により、新しい治療用途とバイオテクノロジーの革新が可能になります。
RNA設計を強化するために、このペーパーでは、RIBOGENを紹介します。これは、RNA配列と全原子3D構造を同時に生成する最初の深い学習モデルです。
リボーゲンは、マルチモーダルデータ表現での離散フローマッチングと一致する標準フローを活用します。
リボーゲンは、3次元の幾何学を効率的に処理および学習するためのユークリッド等量ニューラルネットワークに基づいています。
我々の実験は、リボーゲンが化学的にもっともらしいRNAサンプルを効率的に生成できることを示しており、配列と構造の共生成がRNAをモデル化するための競争的アプローチであることを示唆しています。

要約(オリジナル)

Ribonucleic acid (RNA) plays fundamental roles in biological systems, from carrying genetic information to performing enzymatic function. Understanding and designing RNA can enable novel therapeutic application and biotechnological innovation. To enhance RNA design, in this paper we introduce RiboGen, the first deep learning model to simultaneously generate RNA sequence and all-atom 3D structure. RiboGen leverages the standard Flow Matching with Discrete Flow Matching in a multimodal data representation. RiboGen is based on Euclidean Equivariant neural networks for efficiently processing and learning three-dimensional geometry. Our experiments show that RiboGen can efficiently generate chemically plausible and self-consistent RNA samples, suggesting that co-generation of sequence and structure is a competitive approach for modeling RNA.

arxiv情報

著者 Dana Rubin,Allan dos Santos Costa,Manvitha Ponnapati,Joseph Jacobson
発行日 2025-04-18 16:16:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク