AtomSurf : Surface Representation for Learning on Protein Structures

要約

Cryo-EM およびタンパク質構造予測アルゴリズムの最近の進歩により、大規模なタンパク質構造にアクセスできるようになり、機械学習ベースの機能アノテーションへの道が開かれました。幾何学ディープラーニングの分野は、幾何学データを操作するメソッドの作成に焦点を当てています。
タンパク質構造からの学習の重要な側面は、これらの構造を幾何学的なオブジェクト (グリッド、グラフ、または表面) として表現し、この表現に合わせた学習方法を適用することです。
特定のアプローチのパフォーマンスは、表現とそれに対応する学習方法の両方に依存します。
この論文では、タンパク質を $\textit{3D メッシュ サーフェス}$ として表現することを調査し、確立された表現ベンチマークに組み込みます。
私たちの最初の発見は、有望な予備結果にもかかわらず、表面表現だけでは 3D グリッドと競合できないように見えるということです。
これに基づいて、表面表現とグラフベースの手法を組み合わせた相乗的アプローチを導入し、学習に両方の表現を組み込む一般的なフレームワークを実現します。
この組み合わせを使用すると、$\textit{テストされたすべてのタスク}$ にわたって最先端の結果が得られることがわかります。
私たちのコードとデータはオンラインでご覧いただけます: https://github.com/Vincentx15/atom2D 。

要約(オリジナル)

Recent advancements in Cryo-EM and protein structure prediction algorithms have made large-scale protein structures accessible, paving the way for machine learning-based functional annotations.The field of geometric deep learning focuses on creating methods working on geometric data. An essential aspect of learning from protein structures is representing these structures as a geometric object (be it a grid, graph, or surface) and applying a learning method tailored to this representation. The performance of a given approach will then depend on both the representation and its corresponding learning method. In this paper, we investigate representing proteins as $\textit{3D mesh surfaces}$ and incorporate them into an established representation benchmark. Our first finding is that despite promising preliminary results, the surface representation alone does not seem competitive with 3D grids. Building on this, we introduce a synergistic approach, combining surface representations with graph-based methods, resulting in a general framework that incorporates both representations in learning. We show that using this combination, we are able to obtain state-of-the-art results across $\textit{all tested tasks}$. Our code and data can be found online: https://github.com/Vincentx15/atom2D .

arxiv情報

著者 Vincent Mallet,Souhaib Attaiki,Maks Ovsjanikov
発行日 2023-09-28 15:25:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.BM パーマリンク