要約
記号的回帰は、研究された現象を正確に記述する分析式を探索する。このアプローチの主な魅力は、ユーザーにとって洞察力のある解釈可能なモデルを返すことである。歴史的に、記号的回帰のアルゴリズムの大部分は進化的アルゴリズムに基づいている。しかし、代わりに列挙アルゴリズム、混合線形整数計画法、ニューラルネットワーク、ベイズ最適化などのアプローチを利用する新しい提案が最近急増している。実世界のデータでしばしば直面する一般的な課題に対して、これらの新しいアプローチがどの程度有効であるかを評価するために、我々は、2022年の遺伝的・進化的計算会議において、参加者にブラインドで公開された異なる合成データセットと実世界データセットからなるコンペティションを開催した。実世界トラックでは、領域専門家を用いて候補モデルの信頼性を判定することにより、現実的な方法で解釈可能性を評価した。本コンペティションで得られた結果の詳細な分析を行い、記号回帰アルゴリズムの現在の課題について議論し、将来のコンペティションのために可能な改善点を強調する。
要約(オリジナル)
Symbolic regression searches for analytic expressions that accurately describe studied phenomena. The main attraction of this approach is that it returns an interpretable model that can be insightful to users. Historically, the majority of algorithms for symbolic regression have been based on evolutionary algorithms. However, there has been a recent surge of new proposals that instead utilize approaches such as enumeration algorithms, mixed linear integer programming, neural networks, and Bayesian optimization. In order to assess how well these new approaches behave on a set of common challenges often faced in real-world data, we hosted a competition at the 2022 Genetic and Evolutionary Computation Conference consisting of different synthetic and real-world datasets which were blind to entrants. For the real-world track, we assessed interpretability in a realistic way by using a domain expert to judge the trustworthiness of candidate models.We present an in-depth analysis of the results obtained in this competition, discuss current challenges of symbolic regression algorithms and highlight possible improvements for future competitions.
arxiv情報
著者 | F. O. de Franca,M. Virgolin,M. Kommenda,M. S. Majumder,M. Cranmer,G. Espada,L. Ingelse,A. Fonseca,M. Landajuela,B. Petersen,R. Glatt,N. Mundhenk,C. S. Lee,J. D. Hochhalter,D. L. Randall,P. Kamienny,H. Zhang,G. Dick,A. Simon,B. Burlacu,Jaan Kasak,Meera Machado,Casper Wilstrup,W. G. La Cava |
発行日 | 2023-07-03 11:31:36+00:00 |
arxivサイト | arxiv_id(pdf) |