PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

要約

主要なクラスの医薬品であるペプチド治療薬は、糖尿病やがんなどの疾患全体で目覚ましい成功を収めており、2 型糖尿病や肥満の治療に革命をもたらした GLP-1 受容体アゴニストなどの画期的な例があります。
これらの成功にもかかわらず、標的結合親和性、溶解性、膜透過性など、複数の相反する目的を満たすペプチドを設計することは依然として大きな課題です。
古典的な医薬品開発や構造ベースの設計は、治療効果に重要な全体的な機能特性を最適化できないため、このようなタスクには効果がありません。
既存の生成フレームワークは、連続空間、無条件出力、または単一目的のガイダンスに主に限定されているため、複数のプロパティにわたる離散シーケンスの最適化には適していません。
これに対処するために、治療用ペプチド SMILES の生成と最適化を同時に行うための多目的離散拡散モデルである PepTune を紹介します。
Masked Discrete Language Model (MDLM) フレームワークに基づいて構築された PepTune は、状態依存のマスキング スケジュールとペナルティベースの目標により、有効なペプチド構造を保証します。
拡散プロセスを導くために、探索と活用のバランスをとり、パレート最適シーケンスを繰り返し改良するモンテカルロ ツリー検索 (MCTS) ベースの戦略を提案します。
MCTS は、分類子ベースの報酬を検索ツリー拡張と統合し、離散空間に固有の勾配推定の課題とデータの疎性を克服します。
PepTune を使用して、さまざまな疾患関連標的に対する標的結合親和性、膜透過性、溶解性、溶血、非汚染特性などの複数の治療特性に最適化された多様な化学修飾ペプチドを生成します。
全体として、我々の結果は、MCTS 誘導離散拡散が、離散状態空間における多目的シーケンス設計のための強力なモジュール式アプローチであることを示しています。

要約(オリジナル)

Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

arxiv情報

著者 Sophia Tang,Yinuo Zhang,Pranam Chatterjee
発行日 2024-12-23 18:38:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, q-bio.BM パーマリンク