Cell Morphology-Guided Small Molecule Generation with GFlowNets

要約

ハイコンテントイメージング(HCI)を含むハイコンテント表現型スクリーニングは、タンパク質標的に関する事前知識がなくても新規治療薬の特徴を明らかにできるため、ここ数年で人気が高まっています。
分子と表現型の相互作用を予測および表現する深層学習技術と組み合わせると、これらの進歩は創薬アプリケーションを大幅に加速および強化する可能性を秘めています。
この研究は、HCI に基づく分子設計という新しいタスクに焦点を当てています。
分子設計の生成モデルは、たとえば分子を報酬関数として関心のある表現型に結び付ける教師ありモデルなど、HCI データによってガイドされる可能性があります。
ただし、ラベル付きデータが限られており、高次元の読み出しと組み合わせると、これらの方法のトレーニングが困難で非現実的になる可能性があります。
私たちは、教師なしマルチモーダル結合埋め込みを活用して、潜在的な類似性を GFlowNets への報酬として定義する、別のアプローチを検討します。
提案されたモデルは、事前にアノテーションが付けられた表現型ラベルに依存せずに、指定された画像ターゲットと同様の表現型効果を生み出す可能性のある新しい分子を生成する方法を学習します。
我々は、独立したオラクルモデルによって確認されたように、提案された方法がターゲットと形態学的および構造的類似性の高い分子を生成し、同様の生物学的活性の可能性を高めることを実証します。

要約(オリジナル)

High-content phenotypic screening, including high-content imaging (HCI), has gained popularity in the last few years for its ability to characterize novel therapeutics without prior knowledge of the protein target. When combined with deep learning techniques to predict and represent molecular-phenotype interactions, these advancements hold the potential to significantly accelerate and enhance drug discovery applications. This work focuses on the novel task of HCI-guided molecular design. Generative models for molecule design could be guided by HCI data, for example with a supervised model that links molecules to phenotypes of interest as a reward function. However, limited labeled data, combined with the high-dimensional readouts, can make training these methods challenging and impractical. We consider an alternative approach in which we leverage an unsupervised multimodal joint embedding to define a latent similarity as a reward for GFlowNets. The proposed model learns to generate new molecules that could produce phenotypic effects similar to those of the given image target, without relying on pre-annotated phenotypic labels. We demonstrate that the proposed method generates molecules with high morphological and structural similarity to the target, increasing the likelihood of similar biological activity, as confirmed by an independent oracle model.

arxiv情報

著者 Stephen Zhewen Lu,Ziqing Lu,Ehsan Hajiramezanali,Tommaso Biancalani,Yoshua Bengio,Gabriele Scalia,Michał Koziarski
発行日 2024-08-09 17:40:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク