CREMP: Conformer-rotamer ensembles of macrocyclic peptides for machine learning

要約

大環状ペプチドの立体構造をモデル化するための計算および機械学習のアプローチは、合理的な設計と最適化を可能にする可能性を秘めています。
しかし、大環状構造をモデル化するための正確で高速かつスケーラブルな方法は依然として見つかりにくいです。
最近の深層学習アプローチにより、タンパク質の構造予測と小分子立体構造アンサンブルの生成が大幅に加速されましたが、大環状ペプチドについては、その独特の特性により同様の進歩は見られていません。
ここでは、大環状ペプチドの機械学習モデルの迅速な開発と評価のために生成されたリソースである CREMP を紹介します。
CREMP には、Conformer-Rotamer Ensemble Sampling Tool (CREST) を使用して生成された 36,198 個のユニークな大環状ペプチドとその高品質な構造アンサンブルが含まれています。
合計すると、この新しいデータセットには約 3,130 万個の固有の大環状ジオメトリが含まれており、それぞれに半経験的な拡張強結合 (xTB) DFT 計算から得られたエネルギーで注釈が付けられています。
さらに、構造アンサンブルを実験に結び付けるために、報告されている受動的透過性データを含む 3,258 個の大環状化合物が含まれています。
私たちは、このデータセットにより、新しい治療法のペプチド設計と最適化を改善できる機械学習モデルの開発が可能になると期待しています。

要約(オリジナル)

Computational and machine learning approaches to model the conformational landscape of macrocyclic peptides have the potential to enable rational design and optimization. However, accurate, fast, and scalable methods for modeling macrocycle geometries remain elusive. Recent deep learning approaches have significantly accelerated protein structure prediction and the generation of small-molecule conformational ensembles, yet similar progress has not been made for macrocyclic peptides due to their unique properties. Here, we introduce CREMP, a resource generated for the rapid development and evaluation of machine learning models for macrocyclic peptides. CREMP contains 36,198 unique macrocyclic peptides and their high-quality structural ensembles generated using the Conformer-Rotamer Ensemble Sampling Tool (CREST). Altogether, this new dataset contains nearly 31.3 million unique macrocycle geometries, each annotated with energies derived from semi-empirical extended tight-binding (xTB) DFT calculations. Additionally, we include 3,258 macrocycles with reported passive permeability data to couple conformational ensembles to experiment. We anticipate that this dataset will enable the development of machine learning models that can improve peptide design and optimization for novel therapeutics.

arxiv情報

著者 Colin A. Grambow,Hayley Weir,Christian N. Cunningham,Tommaso Biancalani,Kangway V. Chuang
発行日 2024-08-09 17:16:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, physics.chem-ph, q-bio.BM パーマリンク