要約
拡散モデルは、近年最も人気があり人気の生成モデルの 1 つとして、多くの研究者の関心を呼び起こし、画像合成、ビデオ生成、分子設計、3D シーンのレンダリングなどのさまざまな生成タスクにおいて着実に優れた利点を示しています。
マルチモーダル生成は、緻密な理論原理と信頼性の高いアプリケーション実践に依存しています。
普及モデルに関するこれらの最近の取り組みの目覚ましい成功は、主に進歩的な設計原則と効率的なアーキテクチャ、トレーニング、推論、展開方法論によるものです。
しかし、普及モデルの迅速な理解と適用に役立つ、これらの原則と実践を要約した包括的かつ詳細なレビューはまだありません。
この調査では、さらなる理論研究、アルゴリズムの移行、およびモデルの指針となる、アーキテクチャ設計、モデル トレーニング、高速推論、信頼性の高い展開における深遠な原則と効率的な実践に主に焦点を当てた、これらの既存の取り組みに対する新しい効率指向の視点を提供します。
読みやすい方法で新しいシナリオに応用できます。
\url{https://github.com/ponyzym/Efficient-DMs-Survey}
要約(オリジナル)
As one of the most popular and sought-after generative models in the recent years, diffusion models have sparked the interests of many researchers and steadily shown excellent advantage in various generative tasks such as image synthesis, video generation, molecule design, 3D scene rendering and multimodal generation, relying on their dense theoretical principles and reliable application practices. The remarkable success of these recent efforts on diffusion models comes largely from progressive design principles and efficient architecture, training, inference, and deployment methodologies. However, there has not been a comprehensive and in-depth review to summarize these principles and practices to help the rapid understanding and application of diffusion models. In this survey, we provide a new efficiency-oriented perspective on these existing efforts, which mainly focuses on the profound principles and efficient practices in architecture designs, model training, fast inference and reliable deployment, to guide further theoretical research, algorithm migration and model application for new scenarios in a reader-friendly way. \url{https://github.com/ponyzym/Efficient-DMs-Survey}
arxiv情報
著者 | Zhiyuan Ma,Yuzhu Zhang,Guoli Jia,Liangliang Zhao,Yichao Ma,Mingjie Ma,Gaofeng Liu,Kaiyan Zhang,Jianjun Li,Bowen Zhou |
発行日 | 2024-10-16 13:10:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google