要約
仮想スクリーニングにおける最近の成功は、大規模なモデルと広範な化学ライブラリによって可能になりました。
ただし、これらの要素を組み合わせるのは困難です。モデルが大きくなるほど、実行コストが高くなり、超大規模なライブラリを実現できなくなります。
これに対処するために、私たちは、類似した生物学的活性を持つ構造的に異なる分子を見つけることを可能にする、標的に依存しない有効性に基づく分子検索モデルを開発しました。
私たちはベスト プラクティスを使用して、プロセッサーに最適化された SIMD 命令に基づく高速検索システムを設計し、超大規模な 40B Enamine REAL ライブラリを 100\% の再現率でスクリーニングできるようにしました。
私たちは、速度パフォーマンスと新規分子の検索品質の両方について、当社のモデルといくつかの最先端のモデルを広範囲にベンチマークしました。
要約(オリジナル)
Recent successes in virtual screening have been made possible by large models and extensive chemical libraries. However, combining these elements is challenging: the larger the model, the more expensive it is to run, making ultra-large libraries unfeasible. To address this, we developed a target-agnostic, efficacy-based molecule search model, which allows us to find structurally dissimilar molecules with similar biological activities. We used the best practices to design fast retrieval system, based on processor-optimized SIMD instructions, enabling us to screen the ultra-large 40B Enamine REAL library with 100\% recall rate. We extensively benchmarked our model and several state-of-the-art models for both speed performance and retrieval quality of novel molecules.
arxiv情報
著者 | Vlad Vinogradov,Ivan Izmailov,Simon Steshin,Kong T. Nguyen |
発行日 | 2024-07-01 01:33:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google