要約
分子配座異性体の拡張サンプルの関連埋め込みを学習するためのシャム ネットワークを調査します。
非対照的な (正のペアのみ) 補助タスクは、ユークリッド ニューラル ネットワーク (E3NN) の教師ありトレーニングに役立ち、ポイント クラウド ジオメトリ周辺の多様体の滑らかさ (MS) を向上させることがわかりました。
関連するパフォーマンス メトリックを維持しながら複数の薬物活性予測タスクのこのプロパティを示し、MS の確率的および回帰設定への拡張を提案します。
表現の崩壊の分析を提供し、タスクの重み付け、潜在次元、および正則化の実質的な効果を見つけます。
提示されたプロトコルが、分子配座異性体からの信頼性の高い E3NN の開発に役立つことを期待しています。
要約(オリジナル)
We investigate Siamese networks for learning related embeddings for augmented samples of molecular conformers. We find that a non-contrastive (positive-pair only) auxiliary task aids in supervised training of Euclidean neural networks (E3NNs) and increases manifold smoothness (MS) around point-cloud geometries. We demonstrate this property for multiple drug-activity prediction tasks while maintaining relevant performance metrics, and propose an extension of MS to probabilistic and regression settings. We provide an analysis of representation collapse, finding substantial effects of task-weighting, latent dimension, and regularization. We expect the presented protocol to aid in the development of reliable E3NNs from molecular conformers, even for small-data drug discovery programs.
arxiv情報
著者 | Michael Maser,Ji Won Park,Joshua Yao-Yu Lin,Jae Hyeon Lee,Nathan C. Frey,Andrew Watkins |
発行日 | 2023-02-15 15:56:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google