opXRD: Open Experimental Powder X-ray Diffraction Database

要約

粉末X線回折(PXRD)実験は、材料構造の特性評価の基礎です。
それらの広範なアプリケーションにもかかわらず、PXRDの回折グラムの分析は、自動運転ラボでのハイスループット発見における自動化とボトルネックに依然として大きな課題を提示しています。
機械学習は、自動化された粉末回折分析を可能にすることにより、このボトルネックを解決することを約束します。
このドメインに機械学習を適用する際の顕著な困難は、十分にサイズの実験データセットがないことです。これにより、研究者は主にシミュレートされたデータをトレーニングすることが制約されています。
ただし、シミュレートされたPXRDパターンでトレーニングされたモデルは、特に高いノイズレベルと背景の上昇を伴う低品質の実験パターンについて、実験パターンへの一般化が限られていることを示しました。
Open Experimental Powder X-Ray回折データベース(OPXRD)を使用すると、ラベル付きおよび非標識実験粉末回折のオープンに利用可能で簡単にアクセス可能なデータセットを提供します。
ラベル付きOPXRDデータを使用して、実験データ上のモデルのパフォーマンスを評価できます。
転送学習方法を通じて。
幅広い材料クラスから、2179個のラベルが付けられた\ numpatterns fractogramsを収集しました。
この継続的な取り組みが、PXRDデータの完全に自動化された分析に向けて機械学習研究を導き、将来の自動運転材料ラボを可能にすることを願っています。

要約(オリジナル)

Powder X-ray diffraction (pXRD) experiments are a cornerstone for materials structure characterization. Despite their widespread application, analyzing pXRD diffractograms still presents a significant challenge to automation and a bottleneck in high-throughput discovery in self-driving labs. Machine learning promises to resolve this bottleneck by enabling automated powder diffraction analysis. A notable difficulty in applying machine learning to this domain is the lack of sufficiently sized experimental datasets, which has constrained researchers to train primarily on simulated data. However, models trained on simulated pXRD patterns showed limited generalization to experimental patterns, particularly for low-quality experimental patterns with high noise levels and elevated backgrounds. With the Open Experimental Powder X-Ray Diffraction Database (opXRD), we provide an openly available and easily accessible dataset of labeled and unlabeled experimental powder diffractograms. Labeled opXRD data can be used to evaluate the performance of models on experimental data and unlabeled opXRD data can help improve the performance of models on experimental data, e.g. through transfer learning methods. We collected \numpatterns diffractograms, 2179 of them labeled, from a wide spectrum of materials classes. We hope this ongoing effort can guide machine learning research toward fully automated analysis of pXRD data and thus enable future self-driving materials labs.

arxiv情報

著者 Daniel Hollarek,Henrik Schopmans,Jona Östreicher,Jonas Teufel,Bin Cao,Adie Alwen,Simon Schweidler,Mriganka Singh,Tim Kodalle,Hanlin Hu,Gregoire Heymans,Maged Abdelsamie,Arthur Hardiagon,Alexander Wieczorek,Siarhei Zhuk,Ruth Schwaiger,Sebastian Siol,François-Xavier Coudert,Moritz Wolf,Carolin M. Sutter-Fella,Ben Breitung,Andrea M. Hodge,Tong-yi Zhang,Pascal Friederich
発行日 2025-03-07 16:59:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.LG パーマリンク