KinDEL: DNA-Encoded Library Dataset for Kinase Inhibitors

要約

DNA エンコード ライブラリ (DEL) は、多様な化学空間を特徴付ける効率的な方法を提供する組み合わせ小分子ライブラリです。
DEL を使用した選択実験は創薬の取り組みにとって極めて重要であり、ヒット発見のための高スループットのスクリーニングを可能にします。
ただし、公開されている DEL データセットの利用可能性が限られているため、そのようなデータを処理するために設計された計算技術の進歩が妨げられています。
このギャップを埋めるために、我々は、マイトジェン活性化プロテインキナーゼ 14 (MAPK14) とディスコイジン ドメイン受容体チロシン キナーゼ 1 (DDR1) という 2 つのキナーゼに関する、最初に公開された大規模な DEL データセットの 1 つである KinDEL を紹介します。
このデータモダリティへの関心は、選択された分子構造の周囲を高密度でサンプリングする広範な教師付き化学データを生成できるため、高まっています。
データのそのようなアプリケーションの 1 つを実証するために、ヒットを識別するための予測モデルを開発するために、さまざまな機械学習手法のベンチマークを行います。
特に、最近の構造ベースの確率的アプローチに焦点を当てます。
最後に、分子のより小さなサブセットでモデルを検証するために、DNA 上と DNA 外の両方の生物物理学的アッセイ データを提供します。
ベンチマークのデータとコードは、https://github.com/insitro/kindel でご覧いただけます。

要約(オリジナル)

DNA-Encoded Libraries (DEL) are combinatorial small molecule libraries that offer an efficient way to characterize diverse chemical spaces. Selection experiments using DELs are pivotal to drug discovery efforts, enabling high-throughput screens for hit finding. However, limited availability of public DEL datasets hinders the advancement of computational techniques designed to process such data. To bridge this gap, we present KinDEL, one of the first large, publicly available DEL datasets on two kinases: Mitogen-Activated Protein Kinase 14 (MAPK14) and Discoidin Domain Receptor Tyrosine Kinase 1 (DDR1). Interest in this data modality is growing due to its ability to generate extensive supervised chemical data that densely samples around select molecular structures. Demonstrating one such application of the data, we benchmark different machine learning techniques to develop predictive models for hit identification; in particular, we highlight recent structure-based probabilistic approaches. Finally, we provide biophysical assay data, both on- and off-DNA, to validate our models on a smaller subset of molecules. Data and code for our benchmarks can be found at: https://github.com/insitro/kindel.

arxiv情報

著者 Benson Chen,Tomasz Danel,Patrick J. McEnaney,Nikhil Jain,Kirill Novikov,Spurti Umesh Akki,Joshua L. Turnbull,Virja Atul Pandya,Boris P. Belotserkovskii,Jared Bryce Weaver,Ankita Biswas,Dat Nguyen,Gabriel H. S. Dreiman,Mohammad Sultan,Nathaniel Stanley,Daniel M Whalen,Divya Kanichar,Christoph Klein,Emily Fox,R. Edward Watts
発行日 2024-10-11 16:03:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM パーマリンク