Kirigami: large convolutional kernels improve deep learning-based RNA secondary structure prediction

要約

リボ核酸 (RNA) 分子の二次構造を予測するための新しい完全畳み込みニューラル ネットワーク (FCN) アーキテクチャを紹介します。
RNA 構造を重み付きグラフとして解釈し、深層学習を使用してヌクレオチド残基間の塩基対形成の確率を推定します。
私たちのモデルに特有なのは、その大規模な 11 ピクセルのカーネルであり、これが RNA 二次構造の特殊なドメインにおいて FCN に明確な利点をもたらすと私たちは主張します。
広く採用されている 1,305 個の分子で構成される標準化されたテスト セットでは、当社のメソッドの精度は現在の最先端 (SOTA) 二次構造予測ソフトウェアの精度を上回り、11 ~ 40% 以上のマシューズ相関係数 (MCC) を達成しています。
全体的な構造では他の主要な方法よりも高く、特に擬似ノットでは 58 ~ 400% 高くなります。

要約(オリジナル)

We introduce a novel fully convolutional neural network (FCN) architecture for predicting the secondary structure of ribonucleic acid (RNA) molecules. Interpreting RNA structures as weighted graphs, we employ deep learning to estimate the probability of base pairing between nucleotide residues. Unique to our model are its massive 11-pixel kernels, which we argue provide a distinct advantage for FCNs on the specialized domain of RNA secondary structures. On a widely adopted, standardized test set comprised of 1,305 molecules, the accuracy of our method exceeds that of current state-of-the-art (SOTA) secondary structure prediction software, achieving a Matthews Correlation Coefficient (MCC) over 11-40% higher than that of other leading methods on overall structures and 58-400% higher on pseudoknots specifically.

arxiv情報

著者 Marc Harary,Chengxin Zhang,Anna Marie Pyle
発行日 2024-06-04 14:58:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, q-bio.BM パーマリンク