Improving Genetic Programming for Symbolic Regression with Equality Graphs

要約

遺伝子プログラミング(GP)を使用したシンボリック回帰モデルの検索には、元の形式または同等の形式で表現を再検討する傾向があります。
同等の式を繰り返し評価することは、すぐにより良い解決策につながることはないため、非効率的です。
ただし、進化的アルゴリズムには多様性が必要であり、後の時点で重要な役割を果たすことができる非アクティブなビルディングブロックの蓄積を可能にする必要があります。
Equality Graphは、式とそれらの同等の形式をコンパクトに保存できるデータ構造であり、式が保存された等価形式のいずれかで訪問されたかどうかを効率的に検証できるようにします。
e-graphを利用して、表現を再訪する可能性を減らすためにサブツリー演算子を適応させます。
Eggpと呼ばれる私たちの適応は、e-Graphに訪問されたすべての表現を保存し、既に訪問された表現を作成するすべての組み合わせをサブツリーの利用可能な選択から除外することができます。
結果は、小さな表現の場合、このアプローチにより、単純なGPアルゴリズムのパフォーマンスが改善され、計算コストを増やすことなくPYSRやオペロンと競合することが示されています。
ハイライトとして、EGGPは、SRBenchから選択したベンチマークのセットと実際のデータセットのセットのために、短いモデルと同時に正確なモデルを確実に配信することができました。

要約(オリジナル)

The search for symbolic regression models with genetic programming (GP) has a tendency of revisiting expressions in their original or equivalent forms. Repeatedly evaluating equivalent expressions is inefficient, as it does not immediately lead to better solutions. However, evolutionary algorithms require diversity and should allow the accumulation of inactive building blocks that can play an important role at a later point. The equality graph is a data structure capable of compactly storing expressions and their equivalent forms allowing an efficient verification of whether an expression has been visited in any of their stored equivalent forms. We exploit the e-graph to adapt the subtree operators to reduce the chances of revisiting expressions. Our adaptation, called eggp, stores every visited expression in the e-graph, allowing us to filter out from the available selection of subtrees all the combinations that would create already visited expressions. Results show that, for small expressions, this approach improves the performance of a simple GP algorithm to compete with PySR and Operon without increasing computational cost. As a highlight, eggp was capable of reliably delivering short and at the same time accurate models for a selected set of benchmarks from SRBench and a set of real-world datasets.

arxiv情報

著者 Fabricio Olivetti de Franca,Gabriel Kronberger
発行日 2025-01-29 18:49:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク