PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion


主要なクラスの医薬品であるペプチド治療薬は、糖尿病やがんなどの疾患全体で目覚ましい成功を収めており、2 型糖尿病や肥満の治療に革命をもたらした GLP-1 受容体アゴニストなどの画期的な例があります。
これに対処するために、治療用ペプチド SMILES の生成と最適化を同時に行うための多目的離散拡散モデルである PepTune を紹介します。
Masked Discrete Language Model (MDLM) フレームワークに基づいて構築された PepTune は、状態依存のマスキング スケジュールとペナルティベースの目標により、有効なペプチド構造を保証します。
拡散プロセスを導くために、探索と活用のバランスをとり、パレート最適シーケンスを繰り返し改良するモンテカルロ ツリー検索 (MCTS) ベースの戦略を提案します。
MCTS は、分類子ベースの報酬を検索ツリー拡張と統合し、離散空間に固有の勾配推定の課題とデータの疎性を克服します。
PepTune を使用して、さまざまな疾患関連標的に対する標的結合親和性、膜透過性、溶解性、溶血、非汚染特性などの複数の治療特性に最適化された多様な化学修飾ペプチドを生成します。
全体として、我々の結果は、MCTS 誘導離散拡散が、離散状態空間における多目的シーケンス設計のための強力なモジュール式アプローチであることを示しています。


Peptide therapeutics, a major class of medicines, have achieved remarkable success across diseases such as diabetes and cancer, with landmark examples such as GLP-1 receptor agonists revolutionizing the treatment of type-2 diabetes and obesity. Despite their success, designing peptides that satisfy multiple conflicting objectives, such as target binding affinity, solubility, and membrane permeability, remains a major challenge. Classical drug development and structure-based design are ineffective for such tasks, as they fail to optimize global functional properties critical for therapeutic efficacy. Existing generative frameworks are largely limited to continuous spaces, unconditioned outputs, or single-objective guidance, making them unsuitable for discrete sequence optimization across multiple properties. To address this, we present PepTune, a multi-objective discrete diffusion model for the simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with state-dependent masking schedules and penalty-based objectives. To guide the diffusion process, we propose a Monte Carlo Tree Search (MCTS)-based strategy that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTS integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity inherent to discrete spaces. Using PepTune, we generate diverse, chemically-modified peptides optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling characteristics on various disease-relevant targets. In total, our results demonstrate that MCTS-guided discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.


著者 Sophia Tang,Yinuo Zhang,Pranam Chatterjee
発行日 2025-01-01 15:34:56+00:00
arxivサイト arxiv_id(pdf)

カテゴリー: cs.AI, q-bio.BM パーマリンク