Do Deep Learning Methods Really Perform Better in Molecular Conformation Generation?

要約

分子コンフォメーション生成 (MCG) は、創薬における基本的かつ重要な問題です。
MCG の問題を解決するために、系統的探索、モデル構築、ランダム探索、距離幾何学、分子動力学、モンテカルロ法など、多くの伝統的な方法が開発されてきました。ただし、分子構造によってはいくつかの制限があります。
最近では、深層学習ベースの MCG 手法が数多くあり、従来の手法よりも大幅に優れていると主張しています。
しかし、驚いたことに、従来の方法に基づいてシンプルで安価なアルゴリズム (パラメーターなし) を設計し、広く使用されている GEOM-QM9 および GEOM-Drugs ベンチマークで、深層学習ベースの MCG 方法に匹敵するか、それよりも優れていることがわかりました。
特に、私たちの設計アルゴリズムは、RDKIT によって生成されたコンフォメーションの単なるクラスタリングです。
私たちの調査結果が、コミュニティが MCG のディープ ラーニング手法を修正するのに役立つことを願っています。
提案されたアルゴリズムのコードは、https://gist.github.com/ZhouGengmo/5b565f51adafcd911c0bc115b2ef027c にあります。

要約(オリジナル)

Molecular conformation generation (MCG) is a fundamental and important problem in drug discovery. Many traditional methods have been developed to solve the MCG problem, such as systematic searching, model-building, random searching, distance geometry, molecular dynamics, Monte Carlo methods, etc. However, they have some limitations depending on the molecular structures. Recently, there are plenty of deep learning based MCG methods, which claim they largely outperform the traditional methods. However, to our surprise, we design a simple and cheap algorithm (parameter-free) based on the traditional methods and find it is comparable to or even outperforms deep learning based MCG methods in the widely used GEOM-QM9 and GEOM-Drugs benchmarks. In particular, our design algorithm is simply the clustering of the RDKIT-generated conformations. We hope our findings can help the community to revise the deep learning methods for MCG. The code of the proposed algorithm could be found at https://gist.github.com/ZhouGengmo/5b565f51adafcd911c0bc115b2ef027c.

arxiv情報

著者 Gengmo Zhou,Zhifeng Gao,Zhewei Wei,Hang Zheng,Guolin Ke
発行日 2023-03-27 14:15:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.LG, q-bio.BM パーマリンク