要約
中央サーバーのない分散設定における、非滑らかで凸面が強く凹面が強い鞍点問題のクラスを検討します。
このクラスの問題のコンセンサス定式化を解決するために、一般的な勾配計算オラクルが主変数と双対変数を更新できるようにする不正確主双ハイブリッド勾配 (不正確 PDHG) 手順を開発します。
まず、確率的分散低減勾配 (SVRG) オラクルを使用した不正確な PDHG のパフォーマンスを調査します。
私たちの数値研究により、SVRG オラクルを使用した IPDHG の反復の初期の保守的な進歩の重要な現象が明らかになりました。
これに取り組むために、一般化確率勾配 (GSG) 計算オラクルを使用して、更新の初期段階で鞍点解への反復の進行を早め、その後 SVRG に切り替えるという、シンプルで効果的な切り替えのアイデアを開発しました。
適切なタイミングでのオラクル。
提案されたアルゴリズムは、圧縮を伴う分散型近接スイッチング確率的勾配法 (C-DPSSG) と名付けられ、線形レートで $\epsilon$ 精度の鞍点解に収束することが証明されています。
私たちの調査では、高精度のソリューションを提供するだけでなく、GSG および SVRG オラクルの最適な収束フェーズを利用することで、C-DPSSG が低/中精度のソリューションをより速く取得するのに適しており、特定のアプリケーションに役立ちます。
2 つのベンチマーク機械学習アプリケーションでの数値実験により、C-DPSSG の競合パフォーマンスが示され、理論的発見が検証されました。
実験で使用されたコードは \href{https://github.com/chhavisharma123/C-DPSSG-CDC2023}{こちら} にあります。
要約(オリジナル)
We consider a class of non-smooth strongly convex-strongly concave saddle point problems in a decentralized setting without a central server. To solve a consensus formulation of problems in this class, we develop an inexact primal dual hybrid gradient (inexact PDHG) procedure that allows generic gradient computation oracles to update the primal and dual variables. We first investigate the performance of inexact PDHG with stochastic variance reduction gradient (SVRG) oracle. Our numerical study uncovers a significant phenomenon of initial conservative progress of iterates of IPDHG with SVRG oracle. To tackle this, we develop a simple and effective switching idea, where a generalized stochastic gradient (GSG) computation oracle is employed to hasten the iterates’ progress to a saddle point solution during the initial phase of updates, followed by a switch to the SVRG oracle at an appropriate juncture. The proposed algorithm is named Decentralized Proximal Switching Stochastic Gradient method with Compression (C-DPSSG), and is proven to converge to an $\epsilon$-accurate saddle point solution with linear rate. Apart from delivering highly accurate solutions, our study reveals that utilizing the best convergence phases of GSG and SVRG oracles makes C-DPSSG well suited for obtaining solutions of low/medium accuracy faster, useful for certain applications. Numerical experiments on two benchmark machine learning applications show C-DPSSG’s competitive performance which validate our theoretical findings. The codes used in the experiments can be found \href{https://github.com/chhavisharma123/C-DPSSG-CDC2023}{here}.
arxiv情報
著者 | Chhavi Sharma,Vishnu Narayanan,P. Balamurugan |
発行日 | 2023-09-13 16:07:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google