Neural networks trained on synthetically generated crystals can extract structural information from ICSD powder X-ray diffractograms

要約

機械学習技術を使用して、粉末 X 線回折図から結晶空間群などの構造情報を抽出することに成功しています。
ただし、ICSD などのデータベースからシミュレートされたディフラクトグラムを直接トレーニングすることは、サイズが限られていること、クラスの不均一性、および特定の構造タイプへの偏りがあるため、困難です。
各空間群の対称操作を使用して、ランダムな座標を持つ合成結晶を生成する代替アプローチを提案します。
このアプローチに基づいて、1 時間あたり最大数百万個のオンザフライで生成された固有の合成ディフラクトグラムで、深い ResNet のようなモデルのオンライン トレーニングを示します。
選択した空間群分類のタスクでは、ほとんどの空間群から見えない ICSD 構造タイプで 79.9% のテスト精度を達成しました。
これは、ICSD 結晶を直接トレーニングする現在の最先端のアプローチの 56.1% の精度を上回っています。
私たちの結果は、人工的に生成された結晶を使用して ICSD 粉末回折図から構造情報を抽出できることを示しています。これにより、粉末 X 線回折の分野で非常に大規模な最先端の機械学習モデルを適用できるようになります。
さらに、自動化された XRD データ分析が特にハイスループット設定で重要な実験データに方法論を適用するための最初のステップを示します。
空間群の予測に焦点を当てましたが、私たちのアプローチは将来的に関連するタスクに拡張される可能性があります。

要約(オリジナル)

Machine learning techniques have successfully been used to extract structural information such as the crystal space group from powder X-ray diffractograms. However, training directly on simulated diffractograms from databases such as the ICSD is challenging due to its limited size, class-inhomogeneity, and bias toward certain structure types. We propose an alternative approach of generating synthetic crystals with random coordinates by using the symmetry operations of each space group. Based on this approach, we demonstrate online training of deep ResNet-like models on up to a few million unique on-the-fly generated synthetic diffractograms per hour. For our chosen task of space group classification, we achieved a test accuracy of 79.9% on unseen ICSD structure types from most space groups. This surpasses the 56.1% accuracy of the current state-of-the-art approach of training on ICSD crystals directly. Our results demonstrate that synthetically generated crystals can be used to extract structural information from ICSD powder diffractograms, which makes it possible to apply very large state-of-the-art machine learning models in the area of powder X-ray diffraction. We further show first steps toward applying our methodology to experimental data, where automated XRD data analysis is crucial, especially in high-throughput settings. While we focused on the prediction of the space group, our approach has the potential to be extended to related tasks in the future.

arxiv情報

著者 Henrik Schopmans,Patrick Reiser,Pascal Friederich
発行日 2023-03-24 15:01:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.LG パーマリンク