2026年最全AI PPT生成工具横评:26款Agent Skill深度解析与选型指南
引言:AI重构PPT制作方式
PPT 的制作过程正在被 AI Agent 彻底重塑。不再是过去那种「输入标题、套一个丑模板」的陈旧体验——现在,你可以在 Claude Code、Codex、Cursor 这类 AI 编程环境里,直接用自然语言告诉 AI 想要什么,它就会在本地为你生成一份完整的演示文稿。
驱动这一切的是 Agent Skill——一套结构化的指令与脚本集合,安装在 AI 代理上之后,它便获得了某个专业领域的操作能力。进入 2026 年,这一赛道迎来了爆炸式增长。Agent Skills Hub 的 PPT 与演示分类已收录 25 个项目,总 Star 数超过 7 万;而我在此次梳理中还发现了至少 2 个同样极具份量的项目未被收录。
本文的目标是为你呈现完整的生态全景,并帮助你回答一个实际的问题:如果你今天就要做一份 PPT,究竟该选哪个?

全景词云
技术路线全景解读
在逐个盘点之前,必须先理清底层的技术路径。这些路径决定了每款工具的能力上限。
HTML 网页演示:输出单文件 HTML,浏览器打开即用。视觉表现力几乎无上限——CSS 动画、WebGL 特效、Canvas 粒子,一切皆可融入。缺点是交付后不可编辑,客户想要修改一个字都得重新生成。
原生 PPTX:生成真正的 .pptx 文件,每一个文字框、形状、图表都能在 PowerPoint 中被点击编辑。拿来就能交付,客户可以直接改动。但视觉效果受限于 PowerPoint 自身的表达能力。
AI 图像驱动:利用 GPT Image 2、NanoBanana 等模型逐页生成高质量视觉图片,再用 PPTX 作为容器。画面的完成度最高,但每一页本质上是一张图,逐字修改很麻烦。
MCP 协议层:并非直接生成 PPT,而是为 LLM 装上一双操控 PowerPoint 的手——通过 MCP 协议让 AI 可以读取、修改、创建 .pptx 文件。
垂直场景专用:主动放弃通用性,专注深耕学术、营销、翻译等具体场景。
综合设计平台:PPT 只是其能力的一个出口。此类项目已经成长为一整套设计系统,可以产出原型、图像、视频等多种内容。
一、HTML 网页演示:视觉表现力的主舞台
这一阵营的 Skill 共同特点就是单文件输出、零构建,浏览器随时打开。它们是视觉冲击力的主战场。
1. frontend-slides — 17.5k Star
| 元信息 | |
|---|---|
| 作者 | @zarazhangrui |
| GitHub | https://github.com/zarazhangrui/frontend-slides |
| Star | 17,530 |
| 语言 | Shell |

frontend-slides
这是 HTML 演示赛道中 Star 数最高的项目,也是最早将「Vibe Coding」理念引入演示文稿创作的 Skill 之一。
其核心理念是 「show, don’t tell」——它不问你想要什么风格,而是直接生成三套预览让你挑选。这恰好解决了一个真实的痛点:多数人说不清楚自己想要的视觉风格,但一看到界面就能立刻分辨出喜欢哪个。
内置 12 套视觉预设,分为暗色系(Bold Signal、Electric Studio、Creative Voltage、Dark Botanical)、亮色系(Notebook Tabs、Pastel Geometry、Split Pastel、Vintage Editorial)和特殊风格(Neon Cyber、Terminal Green、Swiss Modern、Paper & Ink)。每一套都刻意避开了那种让人一眼认出「AI 味」的紫色渐变审美。
最新亮点是 PPT 转换能力——你可以把已有的 PowerPoint 文件转成网页版演示,并保留其中的图片和文字内容。
适合技术分享、Demo Day 以及个人风格感强烈的演讲。
2. guizang-ppt-skill — 8.8k Star
| 元信息 | |
|---|---|
| 作者 | @op7418(歸藏) |
| GitHub | https://github.com/op7418/guizang-ppt-skill |
| Star | 8,832 |
| 语言 | HTML |

旧主题 · Style A 电子杂志风

新主题 · Style B 瑞士国际主义
电子杂志 × 电子墨水的视觉基调。衬线大标题 + 非衬线正文 + 等宽元数据的三级字体分工,WebGL 流体背景仅在 Hero 页面出现,正文页面始终保持极度的克制。
提供了 5 套主题色(墨水经典、靛蓝瓷、森林墨、牛皮纸、沙丘)和 10 种页面布局骨架。支持横向左右翻页,键盘、滚轮、触屏、底部圆点导航全部支持。
一项值得注意的设计哲学是:不允许自定义 hex 色值。作者的态度很明确——「保护美学比给予自由更重要」。这种强主张在 Skill 设计中很少见。同时,这也是一个会定期迭代的项目,作者每次线下分享后都会把踩过的坑写进 checklist。
适合行业私享会、具有强烈个人风格的演讲以及 AI 产品发布。不适合大段表格数据和需要多人协作、频繁编辑的场景。
3. html-ppt-skill (HTML PPT Studio) — 3.8k Star
| 元信息 | |
|---|---|
| 作者 | @lewislulu |
| GitHub | https://github.com/lewislulu/html-ppt-skill |
| Star | 3,834 |
| 语言 | HTML/CSS/JS |

36 Themes

27 CSS animations + 20 Canvas FX
这是目前体量最大的 HTML 演示 Skill。资源规模在同赛道中几乎无人能敌:36 套主题、15 个完整 Deck 模板、31 种单页布局、47 种动画(27 种 CSS + 20 种 Canvas 特效),以及一个真正的演讲者模式。
演讲者模式是其最具差异化的功能:在任何 Deck 中按下 S 键,就会弹出一个独立的演讲者窗口,包含 4 张可拖拽、可调整尺寸的磁吸卡片——当前幻灯片、下一页预览、逐字稿提词器与计时器。两个窗口通过 BroadcastChannel 实时同步,翻页时既不闪烁也不重新加载。
36 套主题覆盖了从极简白、编辑衬线到赛博朋克、蒸汽波、VC 风格路演的全谱系风格。所有颜色和字体都通过纯 CSS 变量控制,只换一行 link 标签,就能为整份 Deck 换一层皮肤。
15 个完整 Deck 模板中,8 个取材自真实世界的演示设计,另外 7 个是通用场景的脚手架(产品发布、技术分享、周报、小红书图文等)。每套模板都自带 150-300 字的逐字稿,特别适合需要演讲备注的场合。
如果你想要一份 HTML 演示,可以先看 frontend-slides 和 guizang-ppt-skill;万一它们的模板不够用,html-ppt-skill 那 36 套主题和演讲者模式可能就是更好的选择。
4. apple-bento-grid — 171 Star
| 元信息 | |
|---|---|
| 作者 | @hubeiqiao |
| GitHub | https://github.com/hubeiqiao/apple-bento-grid |
| Star | 171 |
| 语言 | HTML |

Solo Dev Project Stats
它不做完整的 Deck,不做封面页和正文页,只专注一件事:Apple 风格的 bento grid 展示卡片——那种苹果发布会主题页面上「一组方格,每格一个亮点」的卡片排版。
适合产品发布的特性总览页、技术分享的成果一览页,以及年终汇报的数字一览页。把「小而专」做到了极致。
5. deepseek-v4-deep-dive — 193 Star
| 元信息 | |
|---|---|
| 作者 | @alchaincyf |
| GitHub | https://github.com/alchaincyf/deepseek-v4-deep-dive |
| Star | 193 |
| 语言 | HTML |
这并非一个通用 Skill,而是一份「成品 + 模板」——DeepSeek V4 的深度解读,包含 73 页 PPT、20 分钟讲稿和发布动画。
但当你需要制作「AI 模型 / 产品深度解读」类内容时,它的结构和动画手法可以直接搬过去用,可以视作 HTML PPT 的「开源样板间」。
二、原生 PPTX:商业交付的可靠基石
这里是商业交付的核心战场。凡是要满足「客户能改」「必须套用公司模板」这类要求的 PPT,最后都必然落地为 .pptx 文件。这条路线上的项目数量最多,大多以 python-pptx 作为技术基底。
6. mckinsey-pptx — 426 Star
| 元信息 | |
|---|---|
| 作者 | @seulee26 |
| GitHub | https://github.com/seulee26/mckinsey-pptx |
| Star | 426 |
| 语言 | Python |
注意:非中文项目

axlabs-mckinsey-pptx
包含 40 个麦肯锡风格的幻灯片模板,还带有一个会为自己的选择进行辩护的 subagent——它会自动从 40 个模板中挑出最适合当前内容的那个,然后说明原因。
这种「AI 解释自己决策」的设计在咨询场景中特别有价值。咨询行业的 PPT 本身就是一种为决策辩护的载体,让 Skill 也学会辩护,是一种十分巧妙的结构同构。
7. Mck-ppt-design-skill — 135 Star
| 元信息 | |
|---|---|
| 作者 | @likaku |
| GitHub | https://github.com/likaku/Mck-ppt-design-skill |
| Star | 135 |
| 语言 | Python |

Sample Output
直接对标「咨询风格 PPT 设计系统」。融合了 70 套布局模式 + flat design + python-pptx。作者把咨询公司常用的版式提炼成了一组可调用的库。
与 mckinsey-pptx 属于同类,区别在于侧重点:mckinsey-pptx 的核心是 subagent 决策逻辑,而它的核心是版式的丰富程度。如果你清楚自己想要哪种版式,就选它;如果想交给 AI 帮你挑选,就选前者。
8. ppt-agent-skills — 714 Star
| 元信息 | |
|---|---|
| 作者 | @sunbigfly |
| GitHub | https://github.com/sunbigfly/ppt-agent-skills |
| Star | 714 |
| 语言 | Python |

ppt-agent-skills
定位十分清晰——「像构建软件工程一样生成演示文稿」,一个 code-driven 框架。它把 PPT 的制作流程视为软件工程:需求分析、架构设计、模块组装、测试验证。
这种思路在制作重载 Deck(几十页的技术报告、产品白皮书)时格外有用,它会强迫你进行结构化思考,而不是让模型一页页自由发挥。产出上既提供网页预览,也能导出 PPTX,成功解决了 AI 生成 PPT 最常见的三个问题:内容失控、版式失控和交付不可编辑。
9. claude-office-skills — 631 Star
| 元信息 | |
|---|---|
| 作者 | @tfriedel |
| GitHub | https://github.com/tfriedel/claude-office-skills |
| Star | 631 |
| 语言 | Python |
它不仅覆盖 PPTX,还将 DOCX、XLSX、PDF 一并纳入管理,并带有自动化支持。如果你不想为每一种文档类型单独安装一个 Skill,这个一站式方案正好合适。
10. claude-code-polished-documents-skills — 3 Star
| 元信息 | |
|---|---|
| 作者 | @promptadvisers |
| GitHub | https://github.com/promptadvisers/claude-code-polished-documents-skills |
| Star | 3 |
| 语言 | Python |
这个 Skill 集合曾经的最大卖点是 10 个 premium 品牌主题(McKinsey、Deloitte、Stripe、Apple、Notion 等),除了 PPT 之外,还覆盖 docx、pdf 和 xlsx。不过近期 Star 数出现大幅下滑,维护活跃度需要重新评估。
11. slide-deck-ai — 354 Star
| 元信息 | |
|---|---|
| 作者 | @barun-saha |
| GitHub | https://github.com/barun-saha/slide-deck-ai |
| Star | 354 |
| 语言 | Python |
它的定位是 「与 AI 共创 PowerPoint 幻灯片」——不是让 AI 一次性全部生成,而是与 AI 反复来回打磨。特点是足够轻量,能跑就行,不刻意追求极致视觉。适合工作汇报、内部讨论等不求出彩但求速度的场景。
12. odin-slides — 147 Star
| 元信息 | |
|---|---|
| 作者 | @leonid20000 |
| GitHub | https://github.com/leonid20000/odin-slides |
| Star | 147 |
| 语言 | Python |
解决了一个非常具体的需求——把超长 Word 文档转化为结构清晰的 PPT。写完几十页报告之后,将其压缩成 30 页的演示文稿,这是一个真实且常见的痛点。odin-slides 借助 LLM 自动将 Word 文档拆解、提炼、重组成 PPT 大纲。
适合学者、咨询人员、政府工作人员和企业研究人员——所有遵循「先写长报告,再做演示」工作流的人。
13. ppt-master — 16.6k Star(重量级项目)
| 元信息 | |
|---|---|
| 作者 | @hugohe3 (Hugo He) |
| GitHub | https://github.com/hugohe3/ppt-master |
| Star | 16,626 |
| 语言 | Python |

Academic — structured research format, data-driven
这是整篇盘点中最重要的新增发现。作者 Hugo He 本职是金融从业者(CPA、CPV),因为希望 AI 生成的 PPT 在 PowerPoint 中能够逐字可编辑,便自己动手造出了这套工具。短短几个月,Star 数飙升至 16.6k,增速惊人。
ppt-master 走的是 SVG → 原生 DrawingML 的技术路线:让 LLM 首先生成 SVG(这是 LLM 最擅长的图形格式),再将 SVG 高保真地转换为 PowerPoint 的原生形状。这意味着每一个文字框、每一个形状、每一个图表在 PPTX 中都是真正可点击编辑的对象——不是图片,也不是模板填空。
核心能力包括:
- 从 PDF、DOCX、URL、Markdown 直接生成原生可编辑 PPTX
- 模板复刻:给它任意一份
.pptx,对它说「把这份变成模板」,它就能提取出主题色、字体和版式结构,之后直接复用 - 动画支持:页面切换和元素入场动画均以真实 OOXML 实现,在 PowerPoint 和 Keynote 中均可原生播放
- 语音旁白:基于 edge-tts 的逐页旁白生成,并支持 ElevenLabs / MiniMax 等平台的语音克隆,可导出为 MP4 视频
- 实时预览:生成过程中在本地 5050 端口打开浏览器预览,点选任意元素后即可说「改这个」,形成闭环循环修改
比较遗憾的是,它只有在搭配 Claude Opus / Sonnet 的大上下文窗口时才能达到最佳效果,模型的上下文窗口大小直接决定了最终的输出质量。
三、AI 图像驱动:用最强画面说话
用 AI 图像模型生成每一页的内容图。这条路线的实质是:与其和「AI 做的 PPT 总有股 AI 味儿」对抗,不如直接调用当前最强大的图像模型,生成最接近设计师水准的画面。
14. NanoBanana-PPT-Skills — 2.7k Star
| 元信息 | |
|---|---|
| 作者 | @op7418(歸藏) |
| GitHub | https://github.com/op7418/NanoBanana-PPT-Skills |
| Star | 2,668 |
| 语言 | Python |

NanoBanana-PPT-Skills
歸藏的另一个项目,与 guizang-ppt-skill 走的是完全不同的路线。这个 Skill 基于 NanoBanana 模型自动生成 PPT 图片和视频,支持智能转场与交互式播放。歸藏在两条路线上都进行了布局:HTML 路线服务演讲分享,图像路线服务传播分发。
15. gpt_image_2_skill — 2.1k Star
| 元信息 | |
|---|---|
| 作者 | @wuyoscar |
| GitHub | https://github.com/wuyoscar/gpt_image_2_skill |
| Star | 2,102 |
| 语言 | Python |

gpt_image_2_skill
它并非一个专门做 PPT 的 Skill,而是一个围绕 OpenAI gpt-image-2 构建的提示词画廊 + 提示词库 + agentic skill + CLI,覆盖科研配图、海报、UI mockup、字体、地图等多个图像生成场景。
但它出现在 PPT 榜单里自有道理:很多「图像驱动派」的 PPT Skill 底层调用的其实就是 GPT Image 2。掌握这个工具,你就拿到了底层的图像生成能力,反过来可以定制自己的 PPT 视觉风格。
16. gpt-image2-ppt-skills — 557 Star
| 元信息 | |
|---|---|
| 作者 | @JuneYaooo |
| GitHub | https://github.com/JuneYaooo/gpt-image2-ppt-skills |
| Star | 557 |
| 语言 | Python |

十种内置风格
这个 Skill 的玩法很有意思:把任意一份 .pptx 模板「以图像级逼真度」仿制成你自己的版本——gpt-image-2 负责模仿原模板的视觉版式,你只需要替换内容。同时还附赠了 10 套精选风格作为兜底方案。
适合一个特殊场景:老板或客户给了你一份「就按这个样子做」的 PPT 模板,但你懒得手动复刻。请注意,它的本质是图像级仿制,而非原生级复刻——这会导致成品的可编辑性受到限制,如果客户后续需要修改每一个文字框,请谨慎选择这条路。
17. ppt-image-first — 799 Star
| 元信息 | |
|---|---|
| 作者 | @NyxTides |
| GitHub | https://github.com/NyxTides/ppt-image-first |
| Star | 799 |
| 语言 | Python |

答辩 / 汇报类首页示例
它的名字就直接点出了设计哲学——image-first。先把视觉做到位,再围绕画面组织语言。可以在 Codex、Claude Code、OpenCode CLI 等多种环境中运行,是一个跨 Agent 的灵活工具。
适合内容卡片、社交媒体配图、文章题图这类「图比字重要」的场景。但它的成品更接近高完成度的视觉稿,并不是每一个文字框都能编辑的原生 PPT。如果你需要对其中的文案进行深度修改,请走原生 PPTX 路线。
四、MCP / 协议层:为 LLM 装上操作 PPT 的手
这一类型的 Skill 并不直接生成 PPT,它们的角色是为 LLM 配备操控 PowerPoint 的能力。只要将这些 MCP Server 接入,你的 Claude 或 GPT 就获得了读取、修改、创建 .pptx 文件的本领。
18. Office-PowerPoint-MCP-Server — 1.7k Star
| 元信息 | |
|---|---|
| 作者 | @GongRzhe |
| GitHub | https://github.com/GongRzhe/Office-PowerPoint-MCP-Server |
| Star | 1,708 |
| 语言 | Python |
仓库已停止维护

Office-PowerPoint-MCP-Server
它将 python-pptx 这个老牌库包装成 MCP Server,通过 MCP 协议对外提供创建、编辑、操作 PowerPoint 的工具。如果你希望在 Claude Desktop 或任意 MCP 客户端中直接通过对话来操作 .pptx 文件,这是最直接的方案。它不挑 Skill,它本身就是这些 Skill 的底层平台。
19. PPTAgent — 4.4k Star
| 元信息 | |
|---|---|
| 作者 | @icip-cas(中科院信工所) |
| GitHub | https://github.com/icip-cas/PPTAgent |
| Star | 4,354 |
| 语言 | Python |

高中课堂展示课件
这是一个由学术机构开发的项目——「用于反思式 PowerPoint 生成的 Agentic 框架」。所谓 Reflective,意思是:Agent 每生成完一页之后,会回过头来检查这一页是否正确、是否足够好、是否需要重做。
这是一个相对重型的方案,更接近一份完整的研究框架,而不是即取即用的 Skill。但其思想非常值得借鉴:AI 做的 PPT 之所以经常显得丑,根本原因就在于它缺少「回头看」的环节。
20. mcp-server-okppt — 66 Star
| 元信息 | |
|---|---|
| 作者 | @NeekChaw |
| GitHub | https://github.com/NeekChaw/mcp-server-okppt |
| Star | 66 |
| 语言 | Python |

小红书爆款内容分析报告PPT页面
思路很巧妙:让 LLM 生成 SVG,再将 SVG 高质量地嵌入 PPTX 并保留矢量特性。SVG 恰好是 LLM 最擅长生成的图形格式,把这两者打通,就在 LLM 的强项上造出了更漂亮的 PPT。不过项目目前还处于比较早期的阶段。
五、垂直场景专用:放弃通用,深耕一点
通用 PPT 工具不可能在每个场景中都做到最优。下面这几个项目选择放弃通用性,专注深耕一个具体场景。
21. academic-pptx-skill — 387 Star
| 元信息 | |
|---|---|
| 作者 | @Gabberflast |
| GitHub | https://github.com/Gabberflast/academic-pptx-skill |
| Star | 387 |
| 语言 | — |
为学术会议讲座、研讨会幻灯片、论文答辩、基金简报而设计。强制执行 action title(行动式标题)、结构化论证、展品规范、引用标准以及传播优先的设计。
学术 PPT 与商业 PPT 最大的区别在于:学术 PPT 的标题不是「市场分析」这种名词短语,而是「市场规模在 X 推动下三年内翻番」这类动词式陈述句。这个 Skill 把学术 PPT 的整套套路进行了代码固化。
22. colloquium — 190 Star
| 元信息 | |
|---|---|
| 作者 | @natolambert |
| GitHub | https://github.com/natolambert/colloquium |
| Star | 190 |
| 语言 | Python |
同样面向学术场景,但它走的是 Markdown 原生路线。学者们日常的笔记本来大多就是 Markdown,让 Markdown 直接变成幻灯片,比从 Markdown 再转成 PPTX 更要流畅。适合用 Obsidian 或 VSCode 写笔记,然后直接拿去讲课的人。
23. fullstack-mkt-skills — 385 Star
| 元信息 | |
|---|---|
| 作者 | @minhnv0807 |
| GitHub | https://github.com/minhnv0807/fullstack-mkt-skills |
| Star | 385 |
| 语言 | PowerShell |
这是一个用 PowerShell 编写的 Claude Skill,内含 20 个生产就绪的营销技能:内容日历、TikTok/Meta 广告文案、UGC brief、KPI 计算器、A/B 测试、定价策略、落地页。基准数据基于越南市场 2025-2026。
PPT 只是它所能产出的众多产物之一,它真正解决的是「营销内容流水线」的问题。如果你是做品牌或增长的人,它比任何一个单独的 PPT Skill 都更实用。
24. ppt-translator — 61 Star
| 元信息 | |
|---|---|
| 作者 | @daekeun-ml |
| GitHub | https://github.com/daekeun-ml/ppt-translator |
| Star | 61 |
| 语言 | Python |
一个极为具体的需求——在翻译 PowerPoint 的同时,保留所有格式和结构。底层使用 Amazon Bedrock 的模型,既可以用作 CLI 工具,也可以作为 MCP 接入 Claude 或 Kiro。
对于跨国团队、多语种版本部署和本地化交付来说,这是一个硬刚需。把 PPT 翻译成另一种语言时,最痛的往往不是翻译质量本身,而是格式错位。
六、综合设计平台:当 PPT 只是一种出口
这一类的项目已经超出了「PPT Skill」的边界——它们是平台级产物,PPT 只是其中的一种能力出口。
25. open-design — 40.8k Star
| 元信息 | |
|---|---|
| 作者 | @nexu-io |
| GitHub | https://github.com/nexu-io/open-design |
| Star | 40,822 |
| 语言 | TypeScript |

open-design
榜单中的星数之王,甚至超过了第二名 frontend-slides 的两倍还多。它的定位是 Anthropic Claude Design 的本地优先开源替代品。
能力面上,它可以生成 Web / 桌面 / 移动端原型、幻灯片、图片、视频和 HyperFrame。支持沙箱预览,可导出 HTML、PDF、PPTX、MP4。几乎兼容所有主流 CLI——Claude Code、Codex、Cursor、Gemini、OpenCode、Qwen、Copilot、Hermes、Kimi。
这早已不是一个单纯的 PPT Skill——这是一个「包含了 PPT 能力的完整设计平台」。如果你要做的不仅是 PPT,而是从设计稿到落地的全流程,这个项目很值得关注。
26. docsagent — 687 Star
| 元信息 | |
|---|---|
| 作者 | @docsagent |
| GitHub | https://github.com/docsagent/docsagent |
| Star | 687 |
| 语言 | TypeScript |
它的诞生并非为了制作 PPT。这是一个本地优先的 AI 文档助手,可以索引你桌面上数千份文档并进行对话,数据零云端泄露。
但它出现在 PPT 榜单里的原因是:制作 PPT 的前置步骤往往需要消化大量参考文档。将 docsagent 作为 PPT 工作流的前置「大脑」,再用专业的 PPT Skill 进行产出,是值得考虑的组合搭配。
全量对比速览表
| 排名 | Skill | Star | 语言 | 路线 |
|---|---|---|---|---|
| 1 | open-design | 40.8k | TypeScript | 综合平台 |
| 2 | frontend-slides | 17.5k | Shell | HTML 派 |
| 3 | ppt-master | 16.6k | Python | PPTX 派 |
| 4 | guizang-ppt-skill | 8.8k | HTML | HTML 派 |
| 5 | PPTAgent | 4.4k | Python | 协议层 |
| 6 | html-ppt-skill | 3.8k | HTML | HTML 派 |
| 7 | NanoBanana-PPT-Skills | 2.7k | Python | 图像派 |
| 8 | gpt_image_2_skill | 2.1k | Python | 图像派 |
| 9 | Office-PowerPoint-MCP-Server | 1.7k | Python | 协议层 |
| 10 | ppt-image-first | 799 | Python | 图像派 |
| 11 | ppt-agent-skills | 714 | Python | PPTX 派 |
| 12 | docsagent | 687 | TypeScript | 综合平台 |
| 13 | claude-office-skills | 631 | Python | PPTX 派 |
| 14 | gpt-image2-ppt-skills | 557 | Python | 图像派 |
| 15 | mckinsey-pptx | 426 | Python | PPTX 派 |
| 16 | academic-pptx-skill | 387 | — | 垂直场景 |
| 17 | fullstack-mkt-skills | 385 | PowerShell | 垂直场景 |
| 18 | slide-deck-ai | 354 | Python | PPTX 派 |
| 19 | deepseek-v4-deep-dive | 193 | HTML | HTML 派 |
| 20 | colloquium | 190 | Python | 垂直场景 |
| 21 | apple-bento-grid | 171 | HTML | HTML 派 |
| 22 | odin-slides | 147 | Python | PPTX 派 |
| 23 | Mck-ppt-design-skill | 135 | Python | PPTX 派 |
| 24 | mcp-server-okppt | 66 | Python | 协议层 |
| 25 | ppt-translator | 61 | Python | 垂直场景 |
| 26 | claude-code-polished-documents-skills | 3 | Python | PPTX 派 |
注:Star 数统计于 2026 年 5 月 15 日。这一赛道更新速度极快,数字随时在变,但工具定位和选型逻辑是相对稳定的。
怎么选:11 条决策路径
- 做客户能改的咨询风 PPT:mckinsey-pptx(交给 AI 选模板)或 Mck-ppt-design-skill(你自己选版式)
- 做品牌质感的商业 PPT:claude-code-polished-documents-skills(如果仍在维护的话)或 ppt-agent-skills
- 做原生可编辑的演示文稿:ppt-master。从任意文档直接生成,每个文字框都可编辑,还带有动画和语音
- 演讲用炫酷 HTML Deck:frontend-slides、guizang-ppt-skill 或 html-ppt-skill(后者的演讲者模式和 36 套主题最全面)
- 做 Apple 风格的特性和卡片:apple-bento-grid
- 把长篇 Word 报告转成 PPT:odin-slides
- 做学术报告或会议演讲:academic-pptx-skill(走 PPTX 路线)或 colloquium(走 Markdown 路线)
- 把现有 PPT 翻译成另一种语言:ppt-translator
- 做营销内容(PPT 只是其中一环):fullstack-mkt-skills
- 让 LLM 直接操作电脑里的 PPT 文件:Office-PowerPoint-MCP-Server
- 你做的不仅是 PPT,整套设计流程都要管:open-design
结语
最初,我们只是问「怎么用 AI 把 PPT 做得好看些」。如今局面已经全然不同:学术报告有 academic-pptx-skill,咨询交付有 mckinsey-pptx 和 ppt-master,Apple 风格有 apple-bento-grid,本地化翻译有 ppt-translator,营销流水线有 fullstack-mkt-skills,Word 转 PPT 有 odin-slides,需要演讲者模式有 html-ppt-skill。
最后给出两点提醒。第一,开源绝不等于零门槛,在商用之前回到 GitHub 确认一下 LICENSE 这一步绝不能省。第二,成本并不仅仅只是模型费用——图像驱动路线需要为 GPT Image 2 或 NanoBanana 支付图像生成费用,ppt-master 依赖大上下文模型,综合平台则可能涉及云服务。请选择那条你真正负担得起,并且与你的工作流最匹配的路线。