要約
生成モデルに複数のトレーニング アルゴリズムとアーキテクチャを利用できるようにするには、十分にトレーニングされた生成モデルのグループに対して単一のモデルを形成するための選択メカニズムが必要です。
選択タスクは通常、生成されたデータの多様性と品質に基づいて評価スコアを最大化するモデルを特定することによって対処されます。
ただし、このような最良のモデルを特定するアプローチでは、利用可能なモデルを組み合わせた方が個々のモデルよりも優れたパフォーマンスを発揮できる可能性を見落としています。
この研究では、複数の生成モデルの混合の選択を調査し、二次最適化問題を定式化して、カーネル開始距離 (KID) や R\'{e} を含むカーネルベースの評価スコアの最大値を達成する最適な混合モデルを見つけます。
nyi カーネル エントロピー (RKE)。
可能な限り少ないサンプル クエリを使用してモデルの最適な混合を特定するために、混合上限信頼限界 (Mixture-UCB) と呼ばれるオンライン学習アプローチを提案します。
具体的には、私たちが提案するオンライン学習方法は、混合重みのすべての凸二次関数に拡張でき、UCB アプローチの適用を可能にする濃度限界を証明します。
提案された Mixture-UCB アルゴリズムの残念な点を証明し、いくつかの数値実験を実行して、テキストベースと画像ベースの生成モデルの最適な混合を見つける際に提案された Mixture-UCB 法の成功を示します。
コードベースは https://github.com/Rezaei-Parham/Mixture-UCB で入手できます。
要約(オリジナル)
The availability of multiple training algorithms and architectures for generative models requires a selection mechanism to form a single model over a group of well-trained generation models. The selection task is commonly addressed by identifying the model that maximizes an evaluation score based on the diversity and quality of the generated data. However, such a best-model identification approach overlooks the possibility that a mixture of available models can outperform each individual model. In this work, we explore the selection of a mixture of multiple generative models and formulate a quadratic optimization problem to find an optimal mixture model achieving the maximum of kernel-based evaluation scores including kernel inception distance (KID) and R\'{e}nyi kernel entropy (RKE). To identify the optimal mixture of the models using the fewest possible sample queries, we propose an online learning approach called Mixture Upper Confidence Bound (Mixture-UCB). Specifically, our proposed online learning method can be extended to every convex quadratic function of the mixture weights, for which we prove a concentration bound to enable the application of the UCB approach. We prove a regret bound for the proposed Mixture-UCB algorithm and perform several numerical experiments to show the success of the proposed Mixture-UCB method in finding the optimal mixture of text-based and image-based generative models. The codebase is available at https://github.com/Rezaei-Parham/Mixture-UCB .
arxiv情報
著者 | Parham Rezaei,Farzan Farnia,Cheuk Ting Li |
発行日 | 2024-12-23 14:48:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google