Correct and Optimal: the Regular Expression Inference Challenge

要約

私たちは、コード/言語モデリング、およびより広範な機械学習コミュニティの課題として、正規表現推論 (REI) を提案します。
REI は教師あり機械学習 (ML) およびプログラム最適化タスクであり、例から最小限の正規表現を見つけるという問題を提起します。文字列の 2 つの有限セット $P$ および $N$ とコスト関数 $cost(\cdot)$ が与えられたとします。
の場合、タスクは、$P$ 内のすべての文字列を受け入れ、$N$ 内のすべての文字列を拒否する式 $r$ を生成することですが、$cost(r’)要約(オリジナル)

We propose regular expression inference (REI) as a challenge for code/language modelling, and the wider machine learning community. REI is a supervised machine learning (ML) and program optimisation task, and poses the problem of finding minimal regular expressions from examples: Given two finite sets of strings $P$ and $N$ and a cost function $cost(\cdot)$, the task is to generate an expression $r$ that accepts all strings in $P$ and rejects all strings in $N$, while no other such expression $r’$ exists with $cost(r’)arxiv情報

著者 Mojtaba Valizadeh,Philip John Gorinski,Ignacio Iacobacci,Martin Berger
発行日 2024-05-10 11:16:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.FL, cs.LG パーマリンク