PepTune: De Novo Generation of Therapeutic Peptides with Multi-Objective-Guided Discrete Diffusion

要約

治療ペプチドの笑顔の同時生成と最適化のための多目的離散拡散モデルであるPeptuneを提示します。
マスクされた離散言語モデル(MDLM)フレームワークに基づいて構築されたPeptuneは、新しい結合依存マスキングスケジュールと無効な損失関数を備えた有効なペプチド構造を保証します。
拡散プロセスを導くために、検査と搾取のバランスをとる推論時の多目的ガイダンスアルゴリズムであるモンテカルロツリーガイダンス(MCTG)を紹介します。
MCTGは、分類器ベースの報酬を検索ツリーの拡張と統合し、勾配推定の課題とデータスパースを克服します。
Peptuneを使用して、さまざまな疾患関連ターゲットの標的結合親和性、膜透過性、溶解度、溶血、および非フーリングなど、複数の治療特性に対して同時に最適化された多様な化学的に修飾されたペプチドを生成します。
合計で、我々の結果は、マスクされた離散拡散のMCTGが、離散状態空間での多目的シーケンス設計の強力でモジュール式アプローチであることを示しています。

要約(オリジナル)

We present PepTune, a multi-objective discrete diffusion model for simultaneous generation and optimization of therapeutic peptide SMILES. Built on the Masked Discrete Language Model (MDLM) framework, PepTune ensures valid peptide structures with a novel bond-dependent masking schedule and invalid loss function. To guide the diffusion process, we introduce Monte Carlo Tree Guidance (MCTG), an inference-time multi-objective guidance algorithm that balances exploration and exploitation to iteratively refine Pareto-optimal sequences. MCTG integrates classifier-based rewards with search-tree expansion, overcoming gradient estimation challenges and data sparsity. Using PepTune, we generate diverse, chemically-modified peptides simultaneously optimized for multiple therapeutic properties, including target binding affinity, membrane permeability, solubility, hemolysis, and non-fouling for various disease-relevant targets. In total, our results demonstrate that MCTG for masked discrete diffusion is a powerful and modular approach for multi-objective sequence design in discrete state spaces.

arxiv情報

著者 Sophia Tang,Yinuo Zhang,Pranam Chatterjee
発行日 2025-06-02 12:07:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, q-bio.BM パーマリンク