Bandit Convex Optimisation

要約

バンディット凸最適化は、0 次の凸最適化を研究するための基本的なフレームワークです。
これらのノートでは、切断面法、内点法、連続指数重み付け、勾配降下法、オンライン ニュートン ステップなど、この問題に使用される多くのツールを取り上げています。
多くの仮定と設定の間の微妙な違いについて説明します。
ここには本当に新しいものはあまりありませんが、いくつかの既存のツールは新しいアルゴリズムを取得するために新しい方法で適用されています。
いくつかの境界がマイナーな方法で改善されています。

要約(オリジナル)

Bandit convex optimisation is a fundamental framework for studying zeroth-order convex optimisation. These notes cover the many tools used for this problem, including cutting plane methods, interior point methods, continuous exponential weights, gradient descent and online Newton step. The nuances between the many assumptions and setups are explained. Although there is not much truly new here, some existing tools are applied in novel ways to obtain new algorithms. A few bounds are improved in minor ways.

arxiv情報

著者 Tor Lattimore
発行日 2024-02-09 16:49:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, stat.ML パーマリンク