要約
タイトル: QSAR用の一致予測手法の開発と評価
要約:
– QSAR回帰モデルは、分子記述子を使用して化合物の生物活性を予測するために共通に使用される技術である。
– QSARモデルからの予測は、分子構造の最適化、実験的テストのための化合物の優先順位付け、および毒性の推定など、多くのことに役立つ。
– 正確な活性の推定に加えて、予測に関連する不確実性の推定を得ることは非常に望ましい。たとえば、真の分子活性が70%、90%、または95%の確率で含まれる予測区間(PI)を計算するなど。
– 予測性能が優れている多くの機械学習(ML)アルゴリズムは、予測の不確実性を推定するためのいくつかのアドオン手法を必要とするため、これらのアルゴリズムの開発は統計的およびMLコミュニティによる活発な研究分野である。
– CPは有望な手法である。予測アルゴリズムに対してアグノスティックであり、データ分布に関する弱い仮定の下で真の予測区間を生成することができる。
– この研究では、最も先進的なMLモデル、Deep Neural NetworksおよびGradient Boosting Machinesに適合した、計算効率の良いCPアルゴリズムを提案した。
– 提案された一致予測方法の妥当性と効率は、多様なQSARデータセットおよびシミュレーション研究で示されている。
要約(オリジナル)
The quantitative structure-activity relationship (QSAR) regression model is a commonly used technique for predicting biological activities of compounds using their molecular descriptors. Predictions from QSAR models can help, for example, to optimize molecular structure; prioritize compounds for further experimental testing; and estimate their toxicity. In addition to the accurate estimation of the activity, it is highly desirable to obtain some estimate of the uncertainty associated with the prediction, e.g., calculate a prediction interval (PI) containing the true molecular activity with a pre-specified probability, say 70%, 90% or 95%. The challenge is that most machine learning (ML) algorithms that achieve superior predictive performance require some add-on methods for estimating uncertainty of their prediction. The development of these algorithms is an active area of research by statistical and ML communities but their implementation for QSAR modeling remains limited. Conformal prediction (CP) is a promising approach. It is agnostic to the prediction algorithm and can produce valid prediction intervals under some weak assumptions on the data distribution. We proposed computationally efficient CP algorithms tailored to the most advanced ML models, including Deep Neural Networks and Gradient Boosting Machines. The validity and efficiency of proposed conformal predictors are demonstrated on a diverse collection of QSAR datasets as well as simulation studies.
arxiv情報
| 著者 | Yuting Xu,Andy Liaw,Robert P. Sheridan,Vladimir Svetnik |
| 発行日 | 2023-04-03 13:41:09+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI