要約
バイレベル最適化は、その応用範囲の広さと高度な階層最適化機能により、近年機械学習において大きな注目を集めている。本論文では、確率的バイレベル最適化手法を開発・分析するためのプラグアンドプレイフレームワーク(PnPBO)を提案する。このフレームワークは[9]で紹介されたシングルループのバイレベル最適化フレームワークに、いくつかの改良を加えながら、最新の非バイアス確率推定量とバイアス確率推定量の両方を統合したものである。PnPBOの実装では、異なる変数に対する全ての確率的推定量を独立に組み込むことができ、上位レベルの変数に対して不偏推定量を使用する場合には、追加の移動平均手法が適用される。理論的分析では、PnPBOの統一的な収束と複雑さの分析を行い、PnPBOの枠組みの中で様々な確率的推定量(PAGE、ZeroSARAH、混合戦略を含む)を適応することで、単一レベル最適化に匹敵する最適なサンプル複雑さが達成されることを実証する。これにより、2値最適化を解くための最適な複雑さの境界が1値最適化のそれと同じかどうかという未解決の疑問が解決される。最後に、我々のフレームワークを実証的に検証し、いくつかのベンチマーク問題でその有効性を示し、我々の理論的知見を確認する。
要約(オリジナル)
Bilevel optimization has recently attracted significant attention in machine learning due to its wide range of applications and advanced hierarchical optimization capabilities. In this paper, we propose a plug-and-play framework, named PnPBO, for developing and analyzing stochastic bilevel optimization methods. This framework integrates both modern unbiased and biased stochastic estimators into the single-loop bilevel optimization framework introduced in [9], with several improvements. In the implementation of PnPBO, all stochastic estimators for different variables can be independently incorporated, and an additional moving average technique is applied when using an unbiased estimator for the upper-level variable. In the theoretical analysis, we provide a unified convergence and complexity analysis for PnPBO, demonstrating that the adaptation of various stochastic estimators (including PAGE, ZeroSARAH, and mixed strategies) within the PnPBO framework achieves optimal sample complexity, comparable to that of single-level optimization. This resolves the open question of whether the optimal complexity bounds for solving bilevel optimization are identical to those for single-level optimization. Finally, we empirically validate our framework, demonstrating its effectiveness on several benchmark problems and confirming our theoretical findings.
arxiv情報
| 著者 | Tianshu Chu,Dachuan Xu,Wei Yao,Chengming Yu,Jin Zhang |
| 発行日 | 2025-05-02 13:26:43+00:00 |
| arxivサイト | arxiv_id(pdf) |