要約
整数線形プログラミング(ILP)は、整数決定変数を使用して自然に説明されている線形最適化問題を解決するためのエレガントなアプローチです。
化学に適用される物理学にインスパイアされた機械学習のコンテキスト内で、サイズ伸展特性を予測するために分子トレーニングセットを選択するためのILP製剤の関連性を示します。
私たちのアルゴリズムは、特にトレーニングセットに存在する分子よりも大きい分子の特性を予測する場合、既存の監視されていないトレーニングセットの選択アプローチを上回ることを示します。
パフォーマンスの向上の理由は、局所的な類似性(つまり、アトムごと)の概念と最適なソリューションを効率的に見つけるユニークなILPアプローチに基づいた選択によるものであると主張します。
全体として、この作業は、物理学にインスパイアされた機械学習モデルのパフォーマンスを改善するための実用的なアルゴリズムを提供し、既存のトレーニングセット選択アプローチとの概念的な違いに関する洞察を提供します。
要約(オリジナル)
Integer linear programming (ILP) is an elegant approach to solve linear optimization problems, naturally described using integer decision variables. Within the context of physics-inspired machine learning applied to chemistry, we demonstrate the relevance of an ILP formulation to select molecular training sets for predictions of size-extensive properties. We show that our algorithm outperforms existing unsupervised training set selection approaches, especially when predicting properties of molecules larger than those present in the training set. We argue that the reason for the improved performance is due to the selection that is based on the notion of local similarity (i.e., per-atom) and a unique ILP approach that finds optimal solutions efficiently. Altogether, this work provides a practical algorithm to improve the performance of physics-inspired machine learning models and offers insights into the conceptual differences with existing training set selection approaches.
arxiv情報
著者 | Matthieu Haeberle,Puck van Gerwen,Ruben Laplaza,Ksenia R. Briling,Jan Weinreich,Friedrich Eisenbrand,Clemence Corminboeuf |
発行日 | 2025-05-01 15:07:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google