A Comprehensive Benchmark for RNA 3D Structure-Function Modeling

要約

RNA構造機能の関係は最近、深い学習コミュニティ内で大きな注目を集めており、核酸構造モデルが前進するにつれて重要性が高まることを約束しています。
ただし、RNA 3D構造の深い学習のための標準化されたアクセス可能なベンチマークがないため、RNA機能特性のモデルの開発が妨げられています。
この作業では、このギャップに対処するために設計されたRNA構造機能予測のための7つのベンチマークデータセットのセットを紹介します。
当社のライブラリは、確立されたPythonライブラリRnaglibの上に構築され、簡単なデータ配布とエンコード、スプリッター、評価方法を提供し、モデルを比較するための便利なオールインワンフレームワークを提供します。
データセットは、完全にモジュール式で再現可能な方法で実装され、コミュニティの貢献とカスタマイズを促進します。
最後に、グラフニューラルネットワークを使用して、すべてのタスクの初期ベースライン結果を提供します。
ソースコード:https://github.com/cgoliver/rnaglibドキュメント:https://rnaglib.org

要約(オリジナル)

The RNA structure-function relationship has recently garnered significant attention within the deep learning community, promising to grow in importance as nucleic acid structure models advance. However, the absence of standardized and accessible benchmarks for deep learning on RNA 3D structures has impeded the development of models for RNA functional characteristics. In this work, we introduce a set of seven benchmarking datasets for RNA structure-function prediction, designed to address this gap. Our library builds on the established Python library rnaglib, and offers easy data distribution and encoding, splitters and evaluation methods, providing a convenient all-in-one framework for comparing models. Datasets are implemented in a fully modular and reproducible manner, facilitating for community contributions and customization. Finally, we provide initial baseline results for all tasks using a graph neural network. Source code: https://github.com/cgoliver/rnaglib Documentation: https://rnaglib.org

arxiv情報

著者 Luis Wyss,Vincent Mallet,Wissam Karroucha,Karsten Borgwardt,Carlos Oliver
発行日 2025-03-27 16:49:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM, stat.ML パーマリンク