AI 将任意文档生成原生可编辑 PPTX — 真正的 PowerPoint 形状和动画,不是图片。作者:Hugo He。
ppt-master 是由 Hugo He(hugohe3)开发的开源 AI 演示文稿框架。截至 2026 年 5 月,已累计获得 20,313 GitHub Stars 和 1,881 Forks,是 AI 驱动演示文稿生成领域最受关注的开源项目。MIT 许可证。Python 占 91.3%。655 次提交。6 个版本发布。
与 SaaS 产品(Gamma.app、Beautiful.ai)不同,ppt-master 生成的是真正原生、可编辑的 PowerPoint 文件(.pptx)—— 真正的形状、真正的文本框、真正的图表。不是静态图片。每个元素都可以在 PowerPoint 中点击编辑。这正是现有 AI PPT 工具的核心痛点所在。
ppt-master 不是一个完整的 Agent,而是一个工具套件。核心公式:harness + model = agent。工具负责编排工作流;模型决定质量上限。这意味着:完全免费,本地运行,零额外订阅成本 —— 你只需要支付自己的模型 API 费用。
ppt-master 采用两阶段流水线:Strategist(内容规划与结构设计)和 Executor(逐页 SVG 生成),最终通过 svg_to_pptx 转换引擎输出原生 PPTX。
graph TB
subgraph INPUT["输入层"]
A1["PDF"]; A2["DOCX"]; A3["URL"]
A4["Markdown"]; A5["纯文本"]
A6["PPTX 模板"]; A7["主题"]
end
subgraph PREPROCESS["预处理"]
B1["转为 Markdown"]
B2["主题研究"]
B3["模板提取"]
end
subgraph PIPELINE["生成流水线"]
C1["Strategist: 内容规划"]
C2["Executor: 逐页生成 SVG"]
C3["视觉审核"]
end
subgraph ENRICH["增强处理"]
D1["AI 生图"]
D2["网页搜索"]
D3["TTS 旁白"]
end
subgraph OUTPUT["输出"]
E1["原生 PPTX"]
E2["SVG 快照"]
E3["MP4 视频"]
end
A1 & A2 & A3 & A4 & A5 --> B1
A6 --> B3; A7 --> B2
B1 & B2 & B3 --> C1
C1 --> C2; C2 --> C3
C3 -->|PASS| D1; C3 -->|PASS| D2; C3 -->|PASS| D3
D1 & D2 --> E1; D3 --> E3
C2 --> E2; D1 & D2 --> E2
约 8 周内发布 4 个版本,展现出极高的迭代速度:
日均约 11.6 次提交。核心开发由 Hugo He 驱动;Claude(AI)为第二贡献者;@WodenJay 贡献了 PR #85(实时预览基础)。
公开约 3 个月内获得近 20,000 Stars—— 这一增长速度超越了绝大多数 AI 开源项目。2026 年 5 月 20 日当周,项目登顶 GitHub Trending 第一及 Trendshift 顶级排名。
v2.5(视频导出)和 v2.6(模板重构)发布后,Star 增速提升约 3 倍。AI YouTuber 和 DevRel KOL 开始自发传播,形成了病毒式传播循环。
ppt-master 基于 Claude Skill 规范,理论上兼容任何支持 Skill 协议的模型。实际使用中,作者强烈推荐 Gemini 3.0 Flash(免费、快速、高质量)或 Qwen3(深度集成),OpenAI 模型可通过第三方适配器作为备选。
零厂商锁定。你可以根据预算、延迟需求和质量要求,在 Gemini、Claude、Qwen 或本地 Ollama 模型之间自由切换 —— 工具始终不变。
ppt-master 的核心差异化能力:AI 为每张幻灯片生成 SVG,而非静态图片。每个 SVG 元素对应一个真实的 PowerPoint 形状 —— 矩形、文本框、图表、线条 —— 可独立编辑。这意味着:在 PowerPoint 中点击任何元素即可修改颜色、字体、大小、数据。目前没有其他 AI PPT 工具能做到这一点。
JSON 清单 + 线程池并发 + 断点续传。支持 Gemini ImageGen(默认)、DALL·E、Stable Diffusion。
零配置。Pexels + Pixabay 集成。自动搜索与幻灯片内容匹配的真实照片。
为每张幻灯片生成语音旁白,导出为 MP4 视频。从文本到视频演示的完整多媒体流水线。
AI 审查 SVG 输出的质量问题。v2.8 新增 SVG 质量检查器,确保输出一致性。
v2.6 重构:三层模板架构 —— Brand(颜色、字体)、Layout(幻灯片结构)、Deck(完整演示文稿风格)。可从现有 PPTX 文件自动提取,确保品牌一致性。可视化模板编辑器(基于浏览器的 SVG 标注工具)让非技术用户无需写代码即可设计自定义模板。
以 Skill 形式分发 —— 一个可在 VSCode、Cursor、Claude Code 和 Codex CLI 中运行的便携式包。v2.8 公开路线图进一步强化了这一"通用工具"设计理念。一段 3 分钟的演示视频展示了:打开 200 页 PDF → 生成 30 页 PPTX(含 AI 图片和旁白)—— 全自动化。
ppt-master 在两个维度上竞争:传统 SaaS AI PPT 工具和开源替代方案。根本差异化优势:原生可编辑 PPTX 输出。SaaS 工具输出图片或锁定格式;ppt-master 输出真正的 PowerPoint 形状。
| 维度 | ppt-master | Gamma.app | Beautiful.ai | SlidesGPT |
|---|---|---|---|---|
| 可编辑形状 | 原生 | 不支持 | 不支持 | 不支持 |
| 价格 | 免费+API | $8/月 | $12/月 | $10/月 |
| 本地运行 | 支持 | 不支持 | 不支持 | 不支持 |
| 视频导出 | MP4+TTS | 有限 | 不支持 | 不支持 |
| 模板 | 三层架构 | 内置 | AI 设计 | 基础 |
| 开源 | MIT | 闭源 | 闭源 | 闭源 |
| 模型支持 | 任意 | 专有 | 专有 | 仅 GPT |
| 项目 | 语言 | Stars | 可编辑 | PPTX | 视频 |
|---|---|---|---|---|---|
| ppt-master | Python | 20.3K | 真实形状 | ✓ | MP4 |
| python-pptx | Python | 3K | 编程式 | ✓ | ✗ |
| marp | JS | 8K | Markdown | ✓ | ✗ |
| reveal.js | JS | 70K | HTML | ✗ | ✗ |
目前市场上没有任何 AI PPT 工具能生成真正可编辑的 PowerPoint 形状。ppt-master 的 SVG 优先方案解决了这一问题。仅凭这一个功能,就足以在所有 SaaS 竞品面前立足。
定位为工具套件而非完整产品,使 ppt-master 获得了任何 SaaS 产品都无法比拟的模型无关灵活性。用户可以自由选择 AI 模型。
655 次提交,日均 11.6 次,8 周 4 个版本。这种 AI 辅助开发带来的迭代速度,对慢节奏竞品形成了天然壁垒。
20K Stars + 1.8K Forks。每个 Fork 都是潜在贡献者,每个 Star 都是潜在推广者。开源的网络效应增长速度远超创业公司的营销预算。
多源交叉验证,引用 27+ 来源:
研究日期:2026年5月26日。GitHub 数据来自官方 API 及网络来源交叉验证。所有链接在撰写时均已核实。