Cross-Gate MLP with Protein Complex Invariant Embedding is A One-Shot Antibody Designer

要約

抗体は、異物または抗原に応答して免疫系によって生成される重要なタンパク質です。
抗体の特異性は、抗体鎖の可変ドメインに位置し、抗原結合部位を形成する相補性決定領域 (CDR) によって決定されます。
これまでの研究では、CDR を生成するために複雑な技術が利用されてきましたが、幾何学的モデリングが不十分であるという問題がありました。
さらに、一般的な反復改良戦略は非効率的な推論につながります。
この論文では、CDR の 1D シーケンスと 3D 構造をワンショットで共同設計できる \textit{シンプルだが効果的} モデルを提案します。
これを達成するために、抗体の CDR 設計問題を 2 つの段階、(i) タンパク質複合体構造の幾何学的モデリング、および (ii) 配列構造の同時学習に分離します。
私たちは、包括的な幾何学的モデリングを実現するために、C$\alpha$、N、C、O 原子を含む骨格原子間の成分内および成分間の相互作用の両方を捕捉する、通常はタンパク質複合体向けの新しい高分子構造不変埋め込みを開発します。
次に、シーケンスと構造の共学習のための単純なクロスゲート MLP を導入し、シーケンスと構造の表現が暗黙的に相互に改良できるようにします。
これにより、モデルは必要な配列と構造をワンショットで設計できるようになります。
配列レベルと構造レベルの両方で結果を評価するために広範な実験が行われ、これにより、当社のモデルが最先端の抗体 CDR 設計法と比較して優れたパフォーマンスを達成することが実証されました。

要約(オリジナル)

Antibodies are crucial proteins produced by the immune system in response to foreign substances or antigens. The specificity of an antibody is determined by its complementarity-determining regions (CDRs), which are located in the variable domains of the antibody chains and form the antigen-binding site. Previous studies have utilized complex techniques to generate CDRs, but they suffer from inadequate geometric modeling. Moreover, the common iterative refinement strategies lead to an inefficient inference. In this paper, we propose a \textit{simple yet effective} model that can co-design 1D sequences and 3D structures of CDRs in a one-shot manner. To achieve this, we decouple the antibody CDR design problem into two stages: (i) geometric modeling of protein complex structures and (ii) sequence-structure co-learning. We develop a novel macromolecular structure invariant embedding, typically for protein complexes, that captures both intra- and inter-component interactions among the backbone atoms, including C$\alpha$, N, C, and O atoms, to achieve comprehensive geometric modeling. Then, we introduce a simple cross-gate MLP for sequence-structure co-learning, allowing sequence and structure representations to implicitly refine each other. This enables our model to design desired sequences and structures in a one-shot manner. Extensive experiments are conducted to evaluate our results at both the sequence and structure levels, which demonstrate that our model achieves superior performance compared to the state-of-the-art antibody CDR design methods.

arxiv情報

著者 Cheng Tan,Zhangyang Gao,Lirong Wu,Jun Xia,Jiangbin Zheng,Xihong Yang,Yue Liu,Bozhen Hu,Stan Z. Li
発行日 2023-12-28 06:33:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.BM パーマリンク