Interpretable Machine Learning for Science with PySR and SymbolicRegression.jl

要約

タイトル:PySRとSymbolicRegression.jlを用いた解釈可能な機械学習のための研究

要約:
– PySRは、人間が解釈可能なシンボリックモデルを発見することを目的とした種類の機械学習である、実用的なシンボリック回帰のオープンソースライブラリである。
– PySRは、多くの分野においてシンボリック回帰を民主化し、普及させることを目的として開発された。
– PySRの内部検索アルゴリズムは、多世代進化アルゴリズムであり、新しく発見された経験的な式の未知のスカラー定数の最適化を目的とした、進化・簡略化・最適化のループを持つ。
– PySRのバックエンドは、SymbolicRegression.jlと呼ばれるJuliaライブラリであり、ユーザー定義の演算子をランタイムでSIMDカーネルに統合し、自動微分を実行し、式の集合をクラスタ全体の数千のコアに分散させることができる。
– このソフトウェアを説明する過程で、私たちは ‘EmpiricalBench’という新しいベンチマークを紹介し、原文や合成データセットからの歴史的な経験式の回復を評価する。

要約(オリジナル)

PySR is an open-source library for practical symbolic regression, a type of machine learning which aims to discover human-interpretable symbolic models. PySR was developed to democratize and popularize symbolic regression for the sciences, and is built on a high-performance distributed back-end, a flexible search algorithm, and interfaces with several deep learning packages. PySR’s internal search algorithm is a multi-population evolutionary algorithm, which consists of a unique evolve-simplify-optimize loop, designed for optimization of unknown scalar constants in newly-discovered empirical expressions. PySR’s backend is the extremely optimized Julia library SymbolicRegression.jl, which can be used directly from Julia. It is capable of fusing user-defined operators into SIMD kernels at runtime, performing automatic differentiation, and distributing populations of expressions to thousands of cores across a cluster. In describing this software, we also introduce a new benchmark, ‘EmpiricalBench,’ to quantify the applicability of symbolic regression algorithms in science. This benchmark measures recovery of historical empirical equations from original and synthetic datasets.

arxiv情報

著者 Miles Cranmer
発行日 2023-05-02 16:31:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: astro-ph.IM, cs.LG, cs.NE, cs.SC, physics.data-an パーマリンク