Outlier-Detection for Reactive Machine Learned Potential Energy Surfaces


大きな予想誤差 (外れ値) を持つサンプルを検出する不確実性定量化 (UQ) は、反応性分子ポテンシャル エネルギー面 (PES) に適用されます。
アンサンブル、深層証拠回帰(DER)、混合ガウスモデル(GMM)の3つの手法が、${\it syn-}$Criegeeとビニルヒドロキシペルオキシドの間の水素転移反応に適用されました。
この結果は、アンサンブル モデルが外れ値の検出に最適な結果をもたらし、次に GMM が続くことを示しています。
たとえば、不確実性が最も大きい 1000 個の構造のプールから、大きな誤差を持つ 25 個または 1000 個の構造を検索した場合、外れ値の検出品質はそれぞれ $\sim 90$ \% および $\sim 50$ \% になります。
それどころか、DER の統計的仮定の限界は、その予測能力に大きな影響を与えました。
最後に、構造ベースの指標は大きな平均誤差と相関していることが判明しました。これは、新しい構造をニューラル ネットワークの改良に有利な構造に迅速に分類するのに役立つ可能性があります。


Uncertainty quantification (UQ) to detect samples with large expected errors (outliers) is applied to reactive molecular potential energy surfaces (PESs). Three methods – Ensembles, Deep Evidential Regression (DER), and Gaussian Mixture Models (GMM) – were applied to the H-transfer reaction between ${\it syn-}$Criegee and vinyl hydroxyperoxide. The results indicate that ensemble models provide the best results for detecting outliers, followed by GMM. For example, from a pool of 1000 structures with the largest uncertainty, the detection quality for outliers is $\sim 90$ \% and $\sim 50$ \%, respectively, if 25 or 1000 structures with large errors are sought. On the contrary, the limitations of the statistical assumptions of DER greatly impacted its prediction capabilities. Finally, a structure-based indicator was found to be correlated with large average error, which may help to rapidly classify new structures into those that provide an advantage for refining the neural network.


著者 Luis Itza Vazquez-Salazar,Silvan Käser,Markus Meuwly
発行日 2024-02-27 17:01:21+00:00
