Drug Discovery SMILES-to-Pharmacokinetics Diffusion Models with Deep Molecular Understanding

要約

人工知能 (AI) は医薬品開発のあらゆる段階でますます使用されています。
創薬 AI が直面する課題の 1 つは、薬物薬物動態 (PK) データセットが相互に独立して収集されることが多く、重複が限られているため、データの重複がまばらになることです。
データの希薄性により、ポリファーマシー、薬剤の組み合わせ研究、ハイスループットのスクリーニングにおける研究上の疑問に答えようとしている研究者にとって、データのキュレーションが困難になっています。
我々は、SMILES 入力を条件とした一連の PK ターゲット特性を生成できる新しい SMILES から薬物動態 (S2PK) 拡散モデルである Imagand を提案します。
Imagand によって生成された合成 PK データが実際のデータの一変量および二変量分布によく似ており、下流のタスクのパフォーマンスが向上することを示します。
Imagand は、データの重複スパース性に対する有望なソリューションであり、研究者が創薬研究用のリガンド PK データを効率的に生成できるようにします。
コードは \url{https://github.com/bing1100/Imagand} で入手できます。

要約(オリジナル)

Artificial intelligence (AI) is increasingly used in every stage of drug development. One challenge facing drug discovery AI is that drug pharmacokinetic (PK) datasets are often collected independently from each other, often with limited overlap, creating data overlap sparsity. Data sparsity makes data curation difficult for researchers looking to answer research questions in poly-pharmacy, drug combination research, and high-throughput screening. We propose Imagand, a novel SMILES-to-Pharmacokinetic (S2PK) diffusion model capable of generating an array of PK target properties conditioned on SMILES inputs. We show that Imagand-generated synthetic PK data closely resembles real data univariate and bivariate distributions, and improves performance for downstream tasks. Imagand is a promising solution for data overlap sparsity and allows researchers to efficiently generate ligand PK data for drug discovery research. Code is available at \url{https://github.com/bing1100/Imagand}.

arxiv情報

著者 Bing Hu,Anita Layton,Helen Chen
発行日 2024-08-14 16:01:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.QM パーマリンク