PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides

要約

ドキュメントからプレゼンテーションを自動的に生成することは、コンテンツの品質、ビジュアル デザイン、構造の一貫性のバランスを必要とする困難なタスクです。
既存の方法は主に、コンテンツの品質を個別に改善および評価することに焦点を当てており、視覚的なデザインや構造の一貫性を見落とすことが多く、実際の適用性が制限されています。
これらの制限に対処するために、人間のワークフローにヒントを得た 2 段階の編集ベースのアプローチを通じてプレゼンテーション生成を包括的に改善する PPTAgent を提案します。
PPTAgent は、まず参照プレゼンテーションを分析してその構造パターンとコンテンツ スキーマを理解し、次にアウトラインを作成し、コード アクションを通じてスライドを生成して、一貫性と整合性を確保します。
生成されたプレゼンテーションの品質を包括的に評価するために、コンテンツ、デザイン、一貫性の 3 つの側面にわたってプレゼンテーションを評価する評価フレームワークである PPTEval をさらに導入します。
実験の結果、PPTAgent は 3 つの側面すべてにおいて従来の自動プレゼンテーション生成方法よりも大幅に優れたパフォーマンスを示しました。
コードとデータは https://github.com/icip-cas/PPTAgent で入手できます。

要約(オリジナル)

Automatically generating presentations from documents is a challenging task that requires balancing content quality, visual design, and structural coherence. Existing methods primarily focus on improving and evaluating the content quality in isolation, often overlooking visual design and structural coherence, which limits their practical applicability. To address these limitations, we propose PPTAgent, which comprehensively improves presentation generation through a two-stage, edit-based approach inspired by human workflows. PPTAgent first analyzes reference presentations to understand their structural patterns and content schemas, then drafts outlines and generates slides through code actions to ensure consistency and alignment. To comprehensively evaluate the quality of generated presentations, we further introduce PPTEval, an evaluation framework that assesses presentations across three dimensions: Content, Design, and Coherence. Experiments show that PPTAgent significantly outperforms traditional automatic presentation generation methods across all three dimensions. The code and data are available at https://github.com/icip-cas/PPTAgent.

arxiv情報

著者 Hao Zheng,Xinyan Guan,Hao Kong,Jia Zheng,Hongyu Lin,Yaojie Lu,Ben He,Xianpei Han,Le Sun
発行日 2025-01-07 16:53:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク