CRISPR: Ensemble Model

要約

Clustered Regularly Interspaced Short Palindromicrepeats (CRISPR) は、生物学と医学の分野に革命をもたらした遺伝子編集技術です。
ただし、CRISPR を使用する際の課題の 1 つは、シングルガイド RNA (sgRNA) のオンターゲット有効性とオフターゲット感度を予測することです。
これは、既存の手法のほとんどが異なる遺伝子と細胞を含む個別のデータセットでトレーニングされており、一般化可能性が制限されているためです。
この論文では、正確かつ一般化可能な sgRNA 設計のための新しいアンサンブル学習方法を提案します。
私たちの方法では、複数の機械学習モデルの予測を組み合わせて、より堅牢な単一の予測を生成します。
このアプローチにより、より広範囲のデータから学習できるようになり、モデルの一般化可能性が向上します。
sgRNA 設計のベンチマーク データセットでこの手法を評価したところ、精度と汎用性の両方の点で既存の手法よりも優れていることがわかりました。
我々の結果は、我々の方法が、新しい遺伝子や細胞に対しても、高い感度と特異性を持って sgRNA を設計するために使用できることを示唆しています。
これは、研究者がさまざまな疾患に対するより効果的で安全な治療法を設計できるようになるため、CRISPR の臨床使用に重要な意味を持つ可能性があります。

要約(オリジナル)

Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR) is a gene editing technology that has revolutionized the fields of biology and medicine. However, one of the challenges of using CRISPR is predicting the on-target efficacy and off-target sensitivity of single-guide RNAs (sgRNAs). This is because most existing methods are trained on separate datasets with different genes and cells, which limits their generalizability. In this paper, we propose a novel ensemble learning method for sgRNA design that is accurate and generalizable. Our method combines the predictions of multiple machine learning models to produce a single, more robust prediction. This approach allows us to learn from a wider range of data, which improves the generalizability of our model. We evaluated our method on a benchmark dataset of sgRNA designs and found that it outperformed existing methods in terms of both accuracy and generalizability. Our results suggest that our method can be used to design sgRNAs with high sensitivity and specificity, even for new genes or cells. This could have important implications for the clinical use of CRISPR, as it would allow researchers to design more effective and safer treatments for a variety of diseases.

arxiv情報

著者 Mohammad Rostami,Amin Ghariyazi,Hamed Dashti,Mohammad Hossein Rohban,Hamid R. Rabiee
発行日 2024-03-05 14:55:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.GN パーマリンク