A Simple Proof of the Mixing of Metropolis-Adjusted Langevin Algorithm under Smoothness and Isoperimetry

要約

$\mathbb{R}^d$ でターゲット密度をサンプリングするための Metropolis-Adjusted Langevin アルゴリズム (MALA) の混合時間を研究します。
ターゲット密度が $\psi_\mu$-isoperimetry を満たし、演算子ノルムとそのヘッセ行列のトレースがそれぞれ $L$ と $\Upsilon$ によって制限されると仮定します。
私たちの主な結果は、ウォーム スタートからターゲット密度までの $\epsilon$-総変動距離を達成するために、MALA が $O\left(\frac{(L\Upsilon)^{\frac12}}{\
psi_\mu^2} \log\left(\frac{1}{\epsilon}\right)\right)$ 反復。
特に、この結果は対数凹サンプリング設定を超えて保持され、混合時間はその上限 $L d$ ではなく $\Upsilon$ のみに依存します。
$m$-strongly logconcave および $L$-log-smooth サンプリング設定では、境界は MALA~\cite{wu2021minimax} の以前の最小混合境界を回復します。

要約(オリジナル)

We study the mixing time of Metropolis-Adjusted Langevin algorithm (MALA) for sampling a target density on $\mathbb{R}^d$. We assume that the target density satisfies $\psi_\mu$-isoperimetry and that the operator norm and trace of its Hessian are bounded by $L$ and $\Upsilon$ respectively. Our main result establishes that, from a warm start, to achieve $\epsilon$-total variation distance to the target density, MALA mixes in $O\left(\frac{(L\Upsilon)^{\frac12}}{\psi_\mu^2} \log\left(\frac{1}{\epsilon}\right)\right)$ iterations. Notably, this result holds beyond the log-concave sampling setting and the mixing time depends on only $\Upsilon$ rather than its upper bound $L d$. In the $m$-strongly logconcave and $L$-log-smooth sampling setting, our bound recovers the previous minimax mixing bound of MALA~\cite{wu2021minimax}.

arxiv情報

著者 Yuansi Chen,Khashayar Gatmiry
発行日 2023-06-08 16:31:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CC, cs.LG, stat.CO, stat.ML パーマリンク