Learning Hard-Constrained Models with One Sample

要約

単一のサンプルを使用して、ハード制約を持つマルコフランダム場のパラメータを推定する問題を検討します。
主な実行例として、$k$-SAT と適切なカラーリング モデル、および一般的な $H$-カラーリング モデルを使用します。
これらすべてについて、肯定的な結果と否定的な結果の両方が得られます。
ソフト制約の場合とは対照的に、我々は特に、単一サンプルの推定が常に可能であるとは限らず、推定量の存在が充足不可能なインスタンスの存在に関連していることを示します。
私たちのアルゴリズムは擬似尤度推定器に基づいています。
$k$-SAT の場合、Moitra のサンプリング アルゴリズム (JACM、2019) からインスピレーションを得た結合手法を使用して、この推定量の分散限界を示します。
カラーリングに関する私たちの肯定的な結果は、この新しい結合アプローチに基づいています。
最大次数 $d$ のグラフ上の $q$ 色付けでは、 $q>d+1$ の場合は線形時間推定器を与えますが、 $q\leq d+1$ の場合は問題は特定できません。
一般的な $H$ カラーリングの場合、Dobrusin 条件などのサンプリングを保証する標準条件では、1 サンプル学習には不十分であることがわかります。
良い面としては、線形時間学習を保証し、適切なカラーリングと許容モデルのアプリケーションを取得するのに十分な一般条件が提供されます。
最大次数 $d$ の式に関する $k$-SAT モデルの場合、 $k\gtrsim 6.45\log d$ の場合には線形時間推定器を提供しますが、 $k\lesssim \log d の場合には問題は特定できなくなります。
$。

要約(オリジナル)

We consider the problem of estimating the parameters of a Markov Random Field with hard-constraints using a single sample. As our main running examples, we use the $k$-SAT and the proper coloring models, as well as general $H$-coloring models; for all of these we obtain both positive and negative results. In contrast to the soft-constrained case, we show in particular that single-sample estimation is not always possible, and that the existence of an estimator is related to the existence of non-satisfiable instances. Our algorithms are based on the pseudo-likelihood estimator. We show variance bounds for this estimator using coupling techniques inspired, in the case of $k$-SAT, by Moitra’s sampling algorithm (JACM, 2019); our positive results for colorings build on this new coupling approach. For $q$-colorings on graphs with maximum degree $d$, we give a linear-time estimator when $q>d+1$, whereas the problem is non-identifiable when $q\leq d+1$. For general $H$-colorings, we show that standard conditions that guarantee sampling, such as Dobrushin’s condition, are insufficient for one-sample learning; on the positive side, we provide a general condition that is sufficient to guarantee linear-time learning and obtain applications for proper colorings and permissive models. For the $k$-SAT model on formulas with maximum degree $d$, we provide a linear-time estimator when $k\gtrsim 6.45\log d$, whereas the problem becomes non-identifiable when $k\lesssim \log d$.

arxiv情報

著者 Andreas Galanis,Alkis Kalavasis,Anthimos Vardis Kandiros
発行日 2023-11-06 18:29:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.DS, cs.LG, math.ST, stat.ML, stat.TH パーマリンク