要約
この論文では、自動機械学習 (AutoML) におけるモジュールの共同最適化を効果的に処理することを目的として、マルチエージェント自動機械学習 (MA2ML) を提案します。
MA2ML は、データ拡張 (AUG)、ニューラル アーキテクチャ検索 (NAS)、ハイパーパラメーター (HPO) などの各機械学習モジュールをエージェントとして、最終的なパフォーマンスを報酬として、マルチエージェント強化学習問題を定式化します。
.
MA2ML は、モジュール間の協調を強化するために限界貢献度に従って各エージェントにクレジットを明示的に割り当て、ポリシー外の学習を組み込んで検索効率を向上させます。
理論的には、MA2ML は同時最適化の単調な改善を保証します。
広範な実験により、MA2ML は計算コストの制約の下で ImageNet で最先端のトップ 1 精度を生み出すことが示されています。
広範なアブレーション研究により、クレジットの割り当てと MA2ML のポリシー外学習の利点が検証されます。
要約(オリジナル)
In this paper, we propose multi-agent automated machine learning (MA2ML) with the aim to effectively handle joint optimization of modules in automated machine learning (AutoML). MA2ML takes each machine learning module, such as data augmentation (AUG), neural architecture search (NAS), or hyper-parameters (HPO), as an agent and the final performance as the reward, to formulate a multi-agent reinforcement learning problem. MA2ML explicitly assigns credit to each agent according to its marginal contribution to enhance cooperation among modules, and incorporates off-policy learning to improve search efficiency. Theoretically, MA2ML guarantees monotonic improvement of joint optimization. Extensive experiments show that MA2ML yields the state-of-the-art top-1 accuracy on ImageNet under constraints of computational cost, e.g., $79.7\%/80.5\%$ with FLOPs fewer than 600M/800M. Extensive ablation studies verify the benefits of credit assignment and off-policy learning of MA2ML.
arxiv情報
著者 | Zhaozhi Wang,Kefan Su,Jian Zhang,Huizhu Jia,Qixiang Ye,Xiaodong Xie,Zongqing Lu |
発行日 | 2022-10-17 13:32:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google