要約
タイトル:超高速自動モデル圧縮のための正確なパフォーマンス予測を学習する方法
要約:
– SeerNetと呼ばれる超高速自動モデル圧縮フレームワークを提案する。
– これまでの手法では、軽量モデルを積極的にトレーニングして望ましい圧縮ポリシーを探索することで、最適な効率的なネットワークを得ることができた。しかし、このプロセスには高いコンピューテーションコストがかかる。
– これに対し、正確なパフォーマンス予測に基づいて圧縮ポリシーを直接最適化することで、超高速自動モデル圧縮が可能になる。
– まず、効率的な進化的探索によって選択された不確実な圧縮ポリシーに基づいてパフォーマンス予測モデルをトレーニングする。
– そして、予想されるパフォーマンスを最大化する勾配によって望ましい圧縮ポリシーを取得する。
– 実験結果は、画像分類と物体検出において、当手法が高い精度と低いコストで圧縮されたモデルを得ることができることを示し、他の自動モデル圧縮手法と比較して有望な結果を示している。
要約(オリジナル)
In this paper, we propose an ultrafast automated model compression framework called SeerNet for flexible network deployment. Conventional non-differen-tiable methods discretely search the desirable compression policy based on the accuracy from exhaustively trained lightweight models, and existing differentiable methods optimize an extremely large supernet to obtain the required compressed model for deployment. They both cause heavy computational cost due to the complex compression policy search and evaluation process. On the contrary, we obtain the optimal efficient networks by directly optimizing the compression policy with an accurate performance predictor, where the ultrafast automated model compression for various computational cost constraint is achieved without complex compression policy search and evaluation. Specifically, we first train the performance predictor based on the accuracy from uncertain compression policies actively selected by efficient evolutionary search, so that informative supervision is provided to learn the accurate performance predictor with acceptable cost. Then we leverage the gradient that maximizes the predicted performance under the barrier complexity constraint for ultrafast acquisition of the desirable compression policy, where adaptive update stepsizes with momentum are employed to enhance optimality of the acquired pruning and quantization strategy. Compared with the state-of-the-art automated model compression methods, experimental results on image classification and object detection show that our method achieves competitive accuracy-complexity trade-offs with significant reduction of the search cost.
arxiv情報
著者 | Ziwei Wang,Jiwen Lu,Han Xiao,Shengyu Liu,Jie Zhou |
発行日 | 2023-04-13 10:52:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI