Accurate RNA 3D structure prediction using a language model-based deep learning approach

要約

RNA の三次元 (3D) 構造を正確に予測することは、依然として未解決の課題です。
RNA の 3D 構造を決定することは、RNA の機能を理解し、RNA を標的とする薬剤開発や合成生物学の設計に情報を与えるために重要です。
RNA の構造の柔軟性は、実験的に決定されたデータの不足につながり、計算による予測の取り組みを複雑にします。
ここでは、配列から一本鎖 RNA の 3D 構造を正確に予測する RNA 言語モデルベースの深層学習手法である RhoFold+ を紹介します。
RhoFold+ は、約 2,370 万の RNA 配列で事前トレーニングされた RNA 言語モデルを統合し、データ不足に対処する技術を活用することにより、RNA 3D 構造予測のための完全に自動化されたエンドツーエンドのパイプラインを提供します。
RNA-Puzzles と CASP15 天然 RNA ターゲットに関する遡及的評価により、人間の専門家グループを含む既存の方法に対する RhoFold+ の優位性が実証されました。
その有効性と一般化可能性は、家族間およびタイプ間評価、および時間打ち切りベンチマークを通じてさらに検証されます。
さらに、RhoFold+ は RNA の二次構造とらせん間角度を予測し、RNA の構造と機能の研究への適用範囲を広げる経験的に検証可能な機能を提供します。

要約(オリジナル)

Accurate prediction of RNA three-dimensional (3D) structure remains an unsolved challenge. Determining RNA 3D structures is crucial for understanding their functions and informing RNA-targeting drug development and synthetic biology design. The structural flexibility of RNA, which leads to scarcity of experimentally determined data, complicates computational prediction efforts. Here, we present RhoFold+, an RNA language model-based deep learning method that accurately predicts 3D structures of single-chain RNAs from sequences. By integrating an RNA language model pre-trained on ~23.7 million RNA sequences and leveraging techniques to address data scarcity, RhoFold+ offers a fully automated end-to-end pipeline for RNA 3D structure prediction. Retrospective evaluations on RNA-Puzzles and CASP15 natural RNA targets demonstrate RhoFold+’s superiority over existing methods, including human expert groups. Its efficacy and generalizability are further validated through cross-family and cross-type assessments, as well as time-censored benchmarks. Additionally, RhoFold+ predicts RNA secondary structures and inter-helical angles, providing empirically verifiable features that broaden its applicability to RNA structure and function studies.

arxiv情報

著者 Tao Shen,Zhihang Hu,Siqi Sun,Di Liu,Felix Wong,Jiuming Wang,Jiayang Chen,Yixuan Wang,Liang Hong,Jin Xiao,Liangzhen Zheng,Tejas Krishnamoorthi,Irwin King,Sheng Wang,Peng Yin,James J. Collins,Yu Li
発行日 2025-01-02 18:03:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM, q-bio.QM パーマリンク