MantisScore: Building Automatic Metrics to Simulate Fine-grained Human Feedback for Video Generation


この論文では、11 の既存のビデオ生成モデルから 37.6K の合成ビデオにわたる人間が提供したマルチアスペクト スコアを含む初の大規模データセットである VideoFeedback をリリースします。
VideoFeedback に基づいて MantisScore (Mantis から初期化) をトレーニングし、自動ビデオ品質評価を可能にします。
実験によると、MantisScore と人間の間のスピアマン相関は、VideoFeedback テストで 77.1 に達し、これまでの最高の指標を約 50 ポイント上回りました。
他の保留された EvalCrafter、GenAI-Bench、および VBench に関するさらなる結果は、MantisScore が他の指標よりも一貫して人間の審査員との相関性がはるかに高いことを示しています。
これらの結果により、MantisScore は人間の評価者にとって、(1) 進捗状況を追跡するためにさまざまなビデオ モデルを評価する (2) ヒューマン フィードバックによる強化学習 (RLHF) でのきめ細かい人間のフィードバックをシミュレートして、現在のビデオを改善するための優れた代用として機能すると考えています。


The recent years have witnessed great advances in video generation. However, the development of automatic video metrics is lagging significantly behind. None of the existing metric is able to provide reliable scores over generated videos. The main barrier is the lack of large-scale human-annotated dataset. In this paper, we release VideoFeedback, the first large-scale dataset containing human-provided multi-aspect score over 37.6K synthesized videos from 11 existing video generative models. We train MantisScore (initialized from Mantis) based on VideoFeedback to enable automatic video quality assessment. Experiments show that the Spearman correlation between MantisScore and humans can reach 77.1 on VideoFeedback-test, beating the prior best metrics by about 50 points. Further result on other held-out EvalCrafter, GenAI-Bench, and VBench show that MantisScore has consistently much higher correlation with human judges than other metrics. Due to these results, we believe MantisScore can serve as a great proxy for human raters to (1) rate different video models to track progress (2) simulate fine-grained human feedback in Reinforcement Learning with Human Feedback (RLHF) to improve current video generation models.


著者 Xuan He,Dongfu Jiang,Ge Zhang,Max Ku,Achint Soni,Sherman Siu,Haonan Chen,Abhranil Chandra,Ziyan Jiang,Aaran Arulraj,Kai Wang,Quy Duc Do,Yuansheng Ni,Bohan Lyu,Yaswanth Narsupalli,Rongqi Fan,Zhiheng Lyu,Yuchen Lin,Wenhu Chen
発行日 2024-06-21 15:43:46+00:00
