Attention-based Multi-task Learning for Base Editor Outcome Prediction

要約

ヒトの遺伝病は点突然変異から生じることが多く、正確なゲノム編集技術の重要な必要性が強調されています。
これらの中でも、塩基編集は、単一ヌクレオチドレベルで標的を絞った変更を可能にするため、際立っています。
しかし、その臨床応用は低い編集効率と意図しない突然変異によって妨げられており、研究室での大規模な試行錯誤の実験が必要です。
このプロセスを高速化するために、特定のゲノム標的配列に対して考えられるすべての編集結果の可能性を予測することを学習する、注意ベースの 2 段階の機械学習モデルを紹介します。
さらに、複数の基本エディター (つまり、バリアント) を一度に共同学習するためのマルチタスク学習スキーマを提案します。
私たちのモデルの予測は、複数のデータセットおよび基本エディターのバリアントでの実際の実験結果との強い相関関係を一貫して実証しました。
これらの結果は、ベース編集デザインを改良するプロセスを強化および加速するモデルの能力をさらに検証します。

要約(オリジナル)

Human genetic diseases often arise from point mutations, emphasizing the critical need for precise genome editing techniques. Among these, base editing stands out as it allows targeted alterations at the single nucleotide level. However, its clinical application is hindered by low editing efficiency and unintended mutations, necessitating extensive trial-and-error experimentation in the laboratory. To speed up this process, we present an attention-based two-stage machine learning model that learns to predict the likelihood of all possible editing outcomes for a given genomic target sequence. We further propose a multi-task learning schema to jointly learn multiple base editors (i.e. variants) at once. Our model’s predictions consistently demonstrated a strong correlation with the actual experimental results on multiple datasets and base editor variants. These results provide further validation for the models’ capacity to enhance and accelerate the process of refining base editing designs.

arxiv情報

著者 Amina Mollaysa,Ahmed Allam,Michael Krauthammer
発行日 2023-11-15 16:06:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.GN パーマリンク