Transfer Learning Bayesian Optimization to Design Competitor DNA Molecules for Use in Diagnostic Assays

要約

人工生体分子デバイスの増加に伴い、オーダーメイドの生物学的配列の必要性が高まっています。
多くの場合、特定の用途向けに同様の生物学的配列を多数作成する必要があるため、その最適化には多数の、場合によっては法外に高価な実験室実験が必要になります。
この論文では、この開発を実現可能にするための転移学習実験計画ワークフローを紹介します。
転移学習サロゲート モデルとベイズ最適化を組み合わせることにより、最適化タスク間で情報を共有することで実験の総数をどのように削減できるかを示します。
私たちは、増幅ベースの診断アッセイで使用する DNA 競合製品の開発からのデータを使用して、実験数の削減を実証します。
相互検証を使用して、さまざまな転移学習モデルの予測精度を比較し、単一目的の最適化タスクとペナルティのある最適化タスクの両方についてモデルのパフォーマンスを比較します。

要約(オリジナル)

With the rise in engineered biomolecular devices, there is an increased need for tailor-made biological sequences. Often, many similar biological sequences need to be made for a specific application meaning numerous, sometimes prohibitively expensive, lab experiments are necessary for their optimization. This paper presents a transfer learning design of experiments workflow to make this development feasible. By combining a transfer learning surrogate model with Bayesian optimization, we show how the total number of experiments can be reduced by sharing information between optimization tasks. We demonstrate the reduction in the number of experiments using data from the development of DNA competitors for use in an amplification-based diagnostic assay. We use cross-validation to compare the predictive accuracy of different transfer learning models, and then compare the performance of the models for both single objective and penalized optimization tasks.

arxiv情報

著者 Ruby Sedgwick,John P. Goertz,Molly M. Stevens,Ruth Misener,Mark van der Wilk
発行日 2024-02-27 17:30:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM, stat.ML パーマリンク