LLMPopcorn: An Empirical Study of LLMs as Assistants for Popular Micro-video Generation

要約

TiktokやYouTubeなどのプラットフォームで支配的な人気のあるマイクロバイデスは、大きな商業的価値を保持しています。
高品質のAI生成コンテンツの上昇は、AI駆動型のマイクロビデオ作成への関心を促進しました。
ただし、CHATGPTやText Generationと推論のDeepSeekなどの大規模な言語モデル(LLM)の高度な機能にもかかわらず、人気のあるマイクロビデオの作成を支援する可能性はほとんどありません。
この論文では、LLM支援の人気のあるマイクロビデオジェネレーション(LLMPopcorn)に関する実証研究を実施しています。
具体的には、次の研究質問を調査します。(i)LLMSをどのようにして効果的に利用して、一般的なマイクロビデオ生成を支援できますか?
(ii)より高い人気のために、迅速なベースの拡張機能がLLM生成コンテンツを最適化することができる程度まで?
(iii)さまざまなLLMやビデオジェネレーターが、人気のあるマイクロビデオ生成タスクでどの程度うまく機能していますか?
これらの質問を調査することにより、DeepSeek-V3のような高度なLLMがマイクロビデオ生成を可能にし、人間が作成したコンテンツに匹敵する人気を達成できることを示します。
迅速な拡張により、人気がさらに高まり、ベンチマークはLLMSでDeepSeek-V3とDeepSeek-R1を強調し、LTX-VideoとHunyuanvideoはビデオ生成でリードしています。
この先駆的な仕事は、AIアシストされたマイクロビデオの作成を進め、新しい研究の機会を明らかにします。
将来の研究をサポートするために、コードとデータセットをリリースします。

要約(オリジナル)

Popular Micro-videos, dominant on platforms like TikTok and YouTube, hold significant commercial value. The rise of high-quality AI-generated content has spurred interest in AI-driven micro-video creation. However, despite the advanced capabilities of large language models (LLMs) like ChatGPT and DeepSeek in text generation and reasoning, their potential to assist the creation of popular micro-videos remains largely unexplored. In this paper, we conduct an empirical study on LLM-assisted popular micro-video generation (LLMPopcorn). Specifically, we investigate the following research questions: (i) How can LLMs be effectively utilized to assist popular micro-video generation? (ii) To what extent can prompt-based enhancements optimize the LLM-generated content for higher popularity? (iii) How well do various LLMs and video generators perform in the popular micro-video generation task? By exploring these questions, we show that advanced LLMs like DeepSeek-V3 enable micro-video generation to achieve popularity comparable to human-created content. Prompt enhancements further boost popularity, and benchmarking highlights DeepSeek-V3 and DeepSeek-R1 among LLMs, while LTX-Video and HunyuanVideo lead in video generation. This pioneering work advances AI-assisted micro-video creation, uncovering new research opportunities. We will release the code and datasets to support future studies.

arxiv情報

著者 Junchen Fu,Xuri Ge,Kaiwen Zheng,Ioannis Arapakis,Xin Xin,Joemon M. Jose
発行日 2025-02-19 02:28:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV パーマリンク