要約
創薬の初期段階では、どの実験を行うかに関する決定は、計算モデルの影響を受ける可能性があります。
実験には時間と費用がかかるため、これらの決定は非常に重要です。
したがって、リソースを最適に使用してモデルの信頼性を向上させるために、機械学習の予測の不確実性を正確に定量化することが不可欠になってきています。
創薬のための計算手法では、限られたデータとまばらな実験観察に悩まされることがよくありますが、追加情報は、観察の正確な値ではなく閾値を提供する打ち切りラベルの形で存在する可能性があります。
ただし、機械学習の不確実性を定量化する標準的なアプローチでは、打ち切りラベルを完全に利用することはできません。
この研究では、生存分析の Tobit モデルを使用して、打ち切りラベルから学習するツールを使用して、アンサンブル ベースのベイジアン モデルとガウス モデルを適応させます。
私たちの結果は、検閲されたラベルで利用できる部分的な情報にもかかわらず、それらが実際の製薬環境を正確かつ確実にモデル化するために不可欠であることを示しています。
要約(オリジナル)
In the early stages of drug discovery, decisions regarding which experiments to pursue can be influenced by computational models. These decisions are critical due to the time-consuming and expensive nature of the experiments. Therefore, it is becoming essential to accurately quantify the uncertainty in machine learning predictions, such that resources can be used optimally and trust in the models improves. While computational methods for drug discovery often suffer from limited data and sparse experimental observations, additional information can exist in the form of censored labels that provide thresholds rather than precise values of observations. However, the standard approaches that quantify uncertainty in machine learning cannot fully utilize censored labels. In this work, we adapt ensemble-based, Bayesian, and Gaussian models with tools to learn from censored labels by using the Tobit model from survival analysis. Our results demonstrate that despite the partial information available in censored labels, they are essential to accurately and reliably model the real pharmaceutical setting.
arxiv情報
| 著者 | Emma Svensson,Hannah Rosa Friesacher,Susanne Winiwarter,Lewis Mervin,Adam Arany,Ola Engkvist |
| 発行日 | 2024-09-06 14:38:47+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google