要約
特定のタンパク質と相互作用するRNA分子の設計は、実験的および計算生物学において重要な課題です。
既存の計算アプローチには、特定のタンパク質ごとに実験的に決定されたRNA配列またはRNA構造の詳細な知識が必要であり、実際に有用性を制限します。
この制限に対処するために、これらの要件なしにタンパク質相互作用のRNA配列を生成するように設計された深い学習ベースのモデルであるRNA-Bangを開発します。
私たちのアプローチの中心は、タンパク質結合RNA配列がより広い配列コンテキストに埋め込まれた機能的結合モチーフをしばしば含むという観察を活用する、双方向の生成(BANG)の新しい生成方法(BANG)です。
まず、RNASに登場する人と同様の局所的なモチーフを含む一般的な合成タスクに関する方法を検証し、既存の生成アプローチに対する利点を示します。
次に、生物学的配列でモデルを評価し、結合タンパク質を考慮して条件付きRNA配列設計に対するその有効性を示します。
要約(オリジナル)
Designing RNA molecules that interact with specific proteins is a critical challenge in experimental and computational biology. Existing computational approaches require a substantial amount of experimentally determined RNA sequences for each specific protein or a detailed knowledge of RNA structure, restricting their utility in practice. To address this limitation, we develop RNA-BAnG, a deep learning-based model designed to generate RNA sequences for protein interactions without these requirements. Central to our approach is a novel generative method, Bidirectional Anchored Generation (BAnG), which leverages the observation that protein-binding RNA sequences often contain functional binding motifs embedded within broader sequence contexts. We first validate our method on generic synthetic tasks involving similar localized motifs to those appearing in RNAs, demonstrating its benefits over existing generative approaches. We then evaluate our model on biological sequences, showing its effectiveness for conditional RNA sequence design given a binding protein.
arxiv情報
| 著者 | Roman Klypa,Alberto Bietti,Sergei Grudinin |
| 発行日 | 2025-02-28 17:51:00+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google