要約
人工知能によって駆動されるビデオ生成は、動的で現実的なコンテンツの作成を可能にし、大幅に進歩しています。
ただし、ビデオシーケンス全体でキャラクターの一貫性を維持することは大きな課題であり、現在のモデルは外観と属性の一貫性を確保するのに苦労しています。
このペーパーでは、AIに生成されたビデオでのキャラクターの一貫性を評価して比較するためのフレームワークであるFace Consecanty Benchmark(FCB)を紹介します。
標準化されたメトリックを提供することにより、ベンチマークは既存のソリューションのギャップを強調し、より信頼性の高いアプローチの開発を促進します。
この作業は、AIビデオ生成テクノロジーのキャラクターの一貫性を改善するための重要なステップを表しています。
要約(オリジナル)
Video generation driven by artificial intelligence has advanced significantly, enabling the creation of dynamic and realistic content. However, maintaining character consistency across video sequences remains a major challenge, with current models struggling to ensure coherence in appearance and attributes. This paper introduces the Face Consistency Benchmark (FCB), a framework for evaluating and comparing the consistency of characters in AI-generated videos. By providing standardized metrics, the benchmark highlights gaps in existing solutions and promotes the development of more reliable approaches. This work represents a crucial step toward improving character consistency in AI video generation technologies.
arxiv情報
著者 | Michal Podstawski,Malgorzata Kudelska,Haohong Wang |
発行日 | 2025-05-16 16:41:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google