要約
グラフ ニューラル ネットワーク (GNN) は、特に新材料発見のための緩和エネルギーの高価な密度汎関数理論計算の代用として、分子特性予測のための驚くほど有能なモデルであることが示されています。
ただし、この文脈における GNN の制限の 1 つは、材料発見パイプラインにとって重要であるため、有用な不確実性予測方法が欠如していることです。
この研究では、構造の最適化が誤差分布に与える影響により、緩和エネルギー計算の不確実性の定量化が、他の種類の分子特性予測の不確実性の定量化よりも複雑であることを示します。
我々は、分布フリー技術が、緩和エネルギー計算を実行する GNN の校正の評価、再校正、および不確実性予測手法の開発にとって、より有用なツールであることを提案します。
また、分布フリーの再校正に基づき、Open Catalyst プロジェクト データセットを使用して、等変 GNN の不確実性手法を評価するための緩和エネルギー タスクも開発します。
我々は、このタスクに関して一連の一般的な不確実性予測手法のベンチマークを行い、新たな改良を加えた潜在距離手法が、緩和エネルギー計算において最も適切に校正された経済的なアプローチであることを示します。
最後に、私たちの潜在空間距離法が、クラスタリングの例、およびトレーニング データセットの外部からの特定の状態方程式と吸着質のカバレッジの例に対する期待と一致する結果を生成することを示します。
要約(オリジナル)
Graph neural networks (GNNs) have been shown to be astonishingly capable models for molecular property prediction, particularly as surrogates for expensive density functional theory calculations of relaxed energy for novel material discovery. However, one limitation of GNNs in this context is the lack of useful uncertainty prediction methods, as this is critical to the material discovery pipeline. In this work, we show that uncertainty quantification for relaxed energy calculations is more complex than uncertainty quantification for other kinds of molecular property prediction, due to the effect that structure optimizations have on the error distribution. We propose that distribution-free techniques are more useful tools for assessing calibration, recalibrating, and developing uncertainty prediction methods for GNNs performing relaxed energy calculations. We also develop a relaxed energy task for evaluating uncertainty methods for equivariant GNNs, based on distribution-free recalibration and using the Open Catalyst Project dataset. We benchmark a set of popular uncertainty prediction methods on this task, and show that latent distance methods, with our novel improvements, are the most well-calibrated and economical approach for relaxed energy calculations. Finally, we demonstrate that our latent space distance method produces results which align with our expectations on a clustering example, and on specific equation of state and adsorbate coverage examples from outside the training dataset.
arxiv情報
著者 | Joseph Musielewicz,Janice Lan,Matt Uyttendaele,John R. Kitchin |
発行日 | 2024-07-15 15:59:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google