一、快速阅读

  1. 功能:PPTAgent 支持从文档自动生成高质量演示文稿,涵盖大纲生成、幻灯片设计与内容评估。
  2. 技术:基于两阶段编辑方法,结合大型语言模型(LLM)实现智能分析与迭代优化。
  3. 应用:适用于教育、企业培训、市场营销等多个领域,提升演示文稿生成效率与质量。

二、PPTAgent 是什么

在这里插入图片描述

PPTAgent 是由中国科学院软件研究所中文信息处理实验室推出的创新框架,旨在通过模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。该框架通过分析参考演示文稿,提取结构模式和内容模式,并基于代码动作草拟大纲并生成幻灯片,确保内容的一致性和对齐。

PPTAgent 基于大型语言模型(LLM)的能力,将演示文稿生成过程分解为迭代的编辑工作流程,从而提高生成演示文稿的连贯性和适应性。此外,PPTAgent 还引入了 PPT Eval 评估框架,从内容、设计和连贯性三个维度全面评估生成的演示文稿质量,为未来的演示文稿生成研究提供宝贵的资源和见解。

三、PPTAgent 的主要功能

  • 分析参考演示文稿:理解其结构模式和内容模式。
  • 草拟大纲:基于分析结果,创建详细的演示文稿大纲。
  • 生成幻灯片:基于代码动作,将大纲转化为具体的幻灯片内容,确保内容的一致性和对齐。
  • 编辑和修正:提供反馈机制,对生成的幻灯片进行编辑和自我修正,提高生成文稿的质量。
  • 综合评估:基于 PPT Eval 框架,从内容、设计和连贯性三个维度评估生成的演示文稿质量。

四、PPTAgent 的技术原理

第一阶段:演示文稿分析

  • 幻灯片聚类:将幻灯片分为结构幻灯片和内容幻灯片,分别通过 LLM 和层次聚类方法进行分析。
  • 模式提取:利用 LLM 的情境感知能力,提取多样化的内容模式,确保编辑的目的性。

第二阶段:演示文稿生成

  • 大纲生成:指导 LLM 创建结构化大纲,结合文档内容和参考演示文稿的语义信息。
  • 幻灯片生成:在大纲指导下,基于迭代编辑参考幻灯片生成新幻灯片,并通过 API 支持文本和视觉元素的编辑。

五、如何运行 PPTAgent

运行该项目一般需要以下几个步骤,确保你已经安装了 Node.js 和 npm(或 yarn)。以下是详细的步骤:

1. 安装 Node.js 和 npm(如未安装)

Vue 项目依赖于 Node.js 环境。如果你还没有安装 Node.js,可以访问 Node.js 官网 下载并安装适合你操作系统的版本。npm 会随 Node.js 一起安装。

2. 克隆该项目到本地运行环境

git clone https://github.com/icip-cas/PPTAgent.git   

3. 进入项目目录

进入到项目web_ui目录。例如:

cd PPTAgent/pptagent_ui   

4. 安装依赖

在项目目录下运行以下命令来安装项目所需的依赖包:

npm install
# 或者使用 yarn
# yarn install

5. 运行开发服务器

安装完依赖后,你可以通过以下命令启动开发服务器:

npm run serve
# 或者使用 yarn
# yarn serve

这将启动一个本地开发服务器,默认情况下会在 http://localhost:8080 提供项目。你可以通过浏览器访问这个地址来查看你的 Vue 应用。

六、如何使用 PPTAgent 评估生成的 PPT

1. 安装依赖
pip install -r requirements.txt
sudo apt install libreoffice
sudo apt install poppler-utils
2. 生成演示文稿
python rebuild.py rebuild_all --out_filename "final.pptx"   
3. 将 PPT 转换为图片
python evals.py pptx2images   
4. 评估演示文稿
python evals.py eval_experiment -s 0 -j 0   

资源

  • GitHub 仓库:https://github.com/icip-cas/PPTAgent
  • arXiv 技术论文:https://arxiv.org/pdf/2501.03936
  • HuggingFace 数据集:https://huggingface.co/datasets/Forceless/Zenodo10K

七、如何系统学习掌握AI大模型?

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 2024行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

5. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐