要約
このホワイトペーパーでは、潜在的な汎用性のあるスケーラブルな方法である潜在的な汎用性のあるスケーラブルな方法である潜在的な汎用性のあるスケーラブルな方法である潜在的な汎用性のあるスケーラブルな方法を紹介します。
この方法は、単一の推論ステップのみを使用して、さまざまな画像から画像間タスクの最先端の結果に達することができることを示します。
その効率に加えて、オブジェクトの削除、通常および深度推定、オブジェクトの再生など、さまざまな画像翻訳タスクにわたるメソッドの汎用性も示します。
また、LBMの条件付きフレームワークを導き出し、制御可能なイメージの学習と影の生成のタスクに取り組むことにより、その有効性を実証します。
https://github.com/gojasper/lbmでメソッドのオープンソース実装を提供します。
要約(オリジナル)
In this paper, we introduce Latent Bridge Matching (LBM), a new, versatile and scalable method that relies on Bridge Matching in a latent space to achieve fast image-to-image translation. We show that the method can reach state-of-the-art results for various image-to-image tasks using only a single inference step. In addition to its efficiency, we also demonstrate the versatility of the method across different image translation tasks such as object removal, normal and depth estimation, and object relighting. We also derive a conditional framework of LBM and demonstrate its effectiveness by tackling the tasks of controllable image relighting and shadow generation. We provide an open-source implementation of the method at https://github.com/gojasper/LBM.
arxiv情報
著者 | Clément Chadebec,Onur Tasar,Sanjeev Sreetharan,Benjamin Aubin |
発行日 | 2025-03-10 17:03:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google