html-ppt-skill是一个基于AgentSkill协议的PPT生成工具,上线20天获得3600+Star。它采用HTML方式生成演示文稿,而非传统的PPTX格式。
项目概述
html-ppt-skill不叫tool或generator,而是命名为skill,遵循agentskills.io开放标准,可在Claude Code、OpenClaw、Hermes Agent、Cursor、Codex等多个平台使用。

为什么选择HTML而非PPTX?
传统的AI生成PPTX方案存在排版错位、字体丢失、图表变形等问题。html-ppt-skill采用HTML方案:
- HTML是纯文本,LLM天然擅长生成
- HTML+CSS+JS是浏览器原生支持的格式,双击即开,零依赖
- HTML可以做到极其精致,效果媲美手动精调
核心功能
36套主题
从适合学术汇报的极简风(minimal-white、editorial-serif),到适合技术分享的赛博风(cyberpunk-neon、terminal-green),再到小红书柔和风(xiaohongshu-white),覆盖多种场景。
按T键可以实时切换主题,36套挨个试,找顺眼的为止。
31种布局
从封面、目录、章节分隔,到代码展示、时间线、架构图、流程图,每种都带真实示例数据。
15套模板
从真实项目中提炼的完整deck:
- tech-sharing:GitHub暗底风格,适合技术分享
- pitch-deck:YC风格的融资路演模板
- xhs-post:3:4竖版的小红书图文
- presenter-mode-reveal:每页带150-300字逐字稿,配合演讲者模式
47个动效
27个CSS动画适合常规入场,20个Canvas FX(粒子爆发、星空飞行、神经网络脉冲)适合封面或关键页。
演讲者模式
按S键弹出独立窗口,包含四个可拖拽可缩放的磁吸卡片:当前页预览、下一页预览、逐字稿、计时器。
每个预览卡片本质上是iframe,加载同一份HTML文件,只是URL多了?preview=N参数。预览和观众看到的完全相同,像素级精确。
翻页时,演讲者窗口通过BroadcastChannel和主窗口同步,用postMessage通知iframe切换,整个过程不重新加载、不白屏、不闪烁。
跨平台兼容
安装命令只有一行:
npx skills add https://github.com/lewislulu/html-ppt-skill
装完之后可在多个平台使用:
- Claude Code:原生支持AgentSkill协议
- OpenClaw:作为claw命令调用
- Hermes Agent:自动注册为/skill斜杠命令
- Cursor、Codex:一行命令安装即用
这是一个遵循agentskills.io开放标准的标准化技能包,装一次,多平台可用。
AI工程新范式
html-ppt-skill的SKILL.md中有一条约束规则:"不要发明新布局,优先组合现有的"。
LLM最擅长在约束条件下做组合,最不擅长从零创造。给它一个清晰的组件库,告诉它"从这31种布局里挑",就能做得又快又稳。
这是一种新的AI工程范式:不是"让AI从零生成一切",而是"人提供约束良好的预制件,AI在组合层面发挥"。
局限性
- 没有可视化编辑器:生成完不满意,需重新让Agent改或手撸HTML
- 不能导出PPTX:可截图导成PNG,但甲方要.pptx文件的话方案受限
- 修改内容需改HTML源码:不懂前端的用户门槛较高
- 演讲者模式依赖弹窗:浏览器拦截弹窗时按S没反应
- Canvas FX没有性能分级:粒子爆发等效果在手机上可能卡顿
使用方式
安装后在Agent中说:
"帮我做一份微服务架构的技术分享PPT,10页,暗色主题,要架构图和代码示例。"
不想装skill也行,直接git clone仓库,跑一下./scripts/new-deck.sh my-talk,浏览器打开生成的HTML即可。
总结
html-ppt-skill的3600+Star,不只是因为它是一个PPT工具,更因为它代表了2026年AI生态变革的方向:同一套技能,可在多个平台使用,没有壁垒,不用迁移,不分阵营。
AI能力的原子单元,正在从"工具"演变成"技能"。