Accelerating materials discovery for polymer solar cells: Data-driven insights enabled by natural language processing

要約

文献からポリマー太陽電池の特性データを抽出し、さまざまなアクティブ ラーニング戦略をシミュレートするために使用された自然言語処理パイプラインを紹介します。
エジソン流の試行錯誤のアプローチよりも早く新規材料を発見するデータ駆動型の手法は十分に確立されていますが、その利点は定量化されていません。
私たちのアプローチは、発見時間が約 75 % 短縮される可能性があることを実証しています。これは、材料イノベーションの 15 年間の加速に相当します。
当社のパイプラインにより、3,300 以上の論文からデータを抽出できます。これは、他社が報告した同様のデータセットよりも最大 5 倍の大きさです。
また、機械学習モデルをトレーニングして電力変換効率を予測し、そのモデルを使用して、まだ報告されていない有望なドナーとアクセプターの組み合わせを特定しました。
したがって、出版された文献から抽出された材料特性データに至るワークフローを示し、そのデータはデータ主導型の洞察を得るために使用されます。
当社の洞察には、材​​料システムの最適化と材料特性の強力な予測モデルのトレーニングを同時に行うことができるアクティブ ラーニング戦略が含まれています。
この研究は、材料科学の研究に貴重な枠組みを提供します。

要約(オリジナル)

We present a natural language processing pipeline that was used to extract polymer solar cell property data from the literature and simulate various active learning strategies. While data-driven methods have been well established to discover novel materials faster than Edisonian trial-and-error approaches, their benefits have not been quantified. Our approach demonstrates a potential reduction in discovery time by approximately 75 %, equivalent to a 15 year acceleration in material innovation. Our pipeline enables us to extract data from more than 3300 papers which is ~5 times larger than similar data sets reported by others. We also trained machine learning models to predict the power conversion efficiency and used our model to identify promising donor-acceptor combinations that are as yet unreported. We thus demonstrate a workflow that goes from published literature to extracted material property data which in turn is used to obtain data-driven insights. Our insights include active learning strategies that can simultaneously optimize the material system and train strong predictive models of material properties. This work provides a valuable framework for research in material science.

arxiv情報

著者 Pranav Shetty,Aishat Adeboye,Sonakshi Gupta,Chao Zhang,Rampi Ramprasad
発行日 2024-02-29 18:54:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cond-mat.mtrl-sci, cs.CL, physics.app-ph パーマリンク