PhAST: Physics-Aware, Scalable, and Task-specific GNNs for Accelerated Catalyst Design


機械学習 (ML) は、大量のデータから材料の特性を効率的にモデル化し、電極触媒の設計を加速する可能性を秘めています。
Open Catalyst プロジェクト OC20 データ セットは、その目的のために構築されました。
ただし、OC20 でトレーニングされた既存の ML モデルのほとんどは、まだ実際のアプリケーションに十分な拡張性や精度がありません。
特に、(1) グラフ作成ステップ、(2) 原子表現、(3) エネルギー予測ヘッドの改善を提案します。
これらの貢献について説明し、いくつかのアーキテクチャで評価したところ、精度を犠牲にすることなく推論時間が最大 5$\times$ 削減されたことがわかりました。


Mitigating the climate crisis requires a rapid transition towards lower carbon energy. Catalyst materials play a crucial role in the electrochemical reactions involved in a great number of industrial processes key to this transition, such as renewable energy storage and electrofuel synthesis. To reduce the amount of energy spent on such processes, we must quickly discover more efficient catalysts to drive the electrochemical reactions. Machine learning (ML) holds the potential to efficiently model the properties of materials from large amounts of data, and thus to accelerate electrocatalyst design. The Open Catalyst Project OC20 data set was constructed to that end. However, most existing ML models trained on OC20 are still neither scalable nor accurate enough for practical applications. Here, we propose several task-specific innovations, applicable to most architectures, which increase both computational efficiency and accuracy. In particular, we propose improvements in (1) the graph creation step, (2) atom representations and (3) the energy prediction head. We describe these contributions and evaluate them on several architectures, showing up to 5$\times$ reduction in inference time without sacrificing accuracy.


著者 Alexandre Duval,Victor Schmidt,Santiago Miret,Yoshua Bengio,Alex Hernández-García,David Rolnick
発行日 2023-06-20 15:53:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, physics.comp-ph パーマリンク