要約
この作業では、多層構造ITO/PEDOT:PSS/P3HT:PCBM/ALを備えたポリマー有機太陽電池(OSC)の電力変換効率(PCE)によって苦しむ時間的分解を表すために、最適な機械学習(ML)モデルのセットを提示します。
その目的のために、996エントリを備えたデータベースを生成しました。これには、180日以上の製造プロセスと環境条件の両方に関する最大7つの変数が含まれています。
次に、単純なコマンドラインインターフェイスによってデータベースに対して順次実行される自動化されたMLプロトコルの集合体をまとめるソフトウェアフレームワークに依存しました。
これにより、最適なモデルが得られるように、網羅的なベンチマークを介してMLモデルの種子を過度に最適化およびランダム化することができます。
達成された精度は、係数測定(R2)の値に広く0.90を超えていますが、ルート平均二乗誤差(RMSE)、2乗誤差(SSE)、および平均絶対誤差(MAE)> 1%のPCEであるPCE。
さらに、データベースで見られなかったOSCの動作をスクリーニングできる検証済みのモデルに貢献します。
その場合、R2〜0.96-0.97およびRMSE〜1%であるため、予測する提案の信頼性が確認されています。
比較目的のために、非線形平均二乗(LMS)に基づく古典的なベイジアン回帰フィッティングも提示されます。これは、単一OSCの単変量ケースに対してのみ十分に実行されます。
したがって、MLモデルによって示された機能の幅を上回ることができません。
最後に、MLフレームワークによって提供される標準化された結果のおかげで、データセットの変数とOSCの最適なパフォーマンスと安定性に対するその意味との間の依存関係を研究します。
再現性は、GitHubで公開されているデータセットを使用して、標準化されたレポートによって完全に保証されます。
要約(オリジナル)
This work presents a set of optimal machine learning (ML) models to represent the temporal degradation suffered by the power conversion efficiency (PCE) of polymeric organic solar cells (OSCs) with a multilayer structure ITO/PEDOT:PSS/P3HT:PCBM/Al. To that aim, we generated a database with 996 entries, which includes up to 7 variables regarding both the manufacturing process and environmental conditions for more than 180 days. Then, we relied on a software framework that brings together a conglomeration of automated ML protocols that execute sequentially against our database by simply command-line interface. This easily permits hyper-optimizing and randomizing seeds of the ML models through exhaustive benchmarking so that optimal models are obtained. The accuracy achieved reaches values of the coefficient determination (R2) widely exceeding 0.90, whereas the root mean squared error (RMSE), sum of squared error (SSE), and mean absolute error (MAE)>1% of the target value, the PCE. Additionally, we contribute with validated models able to screen the behavior of OSCs never seen in the database. In that case, R2~0.96-0.97 and RMSE~1%, thus confirming the reliability of the proposal to predict. For comparative purposes, classical Bayesian regression fitting based on non-linear mean squares (LMS) are also presented, which only perform sufficiently for univariate cases of single OSCs. Hence they fail to outperform the breadth of the capabilities shown by the ML models. Finally, thanks to the standardized results offered by the ML framework, we study the dependencies between the variables of the dataset and their implications for the optimal performance and stability of the OSCs. Reproducibility is ensured by a standardized report altogether with the dataset, which are publicly available at Github.
arxiv情報
著者 | David Valiente,Fernando Rodríguez-Mas,Juan V. Alegre-Requena,David Dalmau,María Flores,Juan C. Ferrer |
発行日 | 2025-05-08 13:47:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google