AI 做 PPT · 18 种风格 + AI 插画 + 端到端产出
来源:花叔 huashu-slides skill · 公众号「花叔」· 30万+粉丝 · AI工具与效率提升
痛点:讲话 1 小时,做 PPT 5 小时
PPT 最让人崩溃的不是”不知道讲什么”,是找配图、对齐元素、配色、凑字数这些无意义的体力活。
教授备一门新课,得花整周末排课件;HR 做培训材料,得反复和设计部拉锯;培训师做分享 deck,光素材授权和排版就耗掉大半天。讲话的内容早想好了,浪费的时间全在”让它好看”上。
AI 能接管这条链路——从大纲到风格选择,从插画生成到 PPTX 导出,全流程一次跑通,拿到可在 PowerPoint/Keynote 打开的成品文件。
开始前的两个选择(Step 0)
花叔的 skill 在每次开始前强制问两个问题,定好工作模式。
0-A · 协作模式
模式 说明 检查点 Full Auto 全自动 最少交互,只确认主题,直接交付 PPTX 1 个 Guided 引导(默认推荐) 确认大纲、选风格、预览后再组装 3 个 Collaborative 协作 每页逐一确认,每张插画逐一审批 每页一次
0-B · 组装方式
方式 原理 适合场景 Path A · 可编辑 HTML HTML 幻灯片 + 选择性 AI 插画 → html2pptx → 可编辑 PPTX 需要后期改文字、精确排版、企业 deck Path B · 全 AI 视觉 每页整张 AI 生成图片 → create_slides.py → 图片 PPTX 视觉冲击最大、艺术演示、快速原型 两种路径的核心区别:Path A 的文字在 PPT 里可以直接双击修改;Path B 的文字烘焙进图片,视觉效果更震撼但不可单独编辑。 不指定时,默认走 Path A。
完整工作流(5 个阶段)
这是 huashu-slides skill 的原始结构:
Content → Design → Build → Assembly → Polish
Step 1 · Content Structuring:把原始素材转化为逐页大纲。每页定义标题(用断言句而非主题词)、3-4 个要点、视觉类型、是否需要插画。
Step 2 · Design System:从 18 种风格里推荐 3 个,用户选一个。关键:设计系统不只是配色——它定义视觉哲学、字体比例、构图规则和情感基调。
Step 3 · Build Slides:Path A 生成 AI 插画 + 制作 HTML 幻灯片;Path B 生成每页完整 AI 图片。
Step 4 · PPTX Assembly:Path A 用 html2pptx 转换;Path B 用 create_slides.py 拼装。
Step 5 · Preview & Polish:预览关键页面,在 Keynote/PowerPoint 里做最终调整(动画、备注、Logo)。
18 种设计风格清单
花叔经过实战验证(2026年小红书介绍 PPT 项目:同一份大纲在 17 种风格下全部一次生成成功),整理出完整的风格体系,共 18 种 + 5 种专业编辑风格。
第一梯队(强烈推荐,AI 生成效果最好)
| # | 风格 | 适合场景 |
|---|---|---|
| 1 | Snoopy 温暖漫画 | 品牌介绍、教育课件、个人 IP |
| 2 | 学習漫画 Manga | 教程、培训、知识分享 |
| 3 | Ligne Claire 清线漫画 | 产品说明、流程解释(信息清晰度最高) |
| 4 | Neo-Pop 新波普 | 年轻品牌、社交平台、活动发布 |
核心洞察:插画/漫画类风格的 AI 生成效果远好于”专业极简”风格。有明确视觉语言(线条、角色、色块)的风格,AI 能充分发挥;纯极简风格(暗色底+大留白)生成出来”空”且”平”。
第二梯队(推荐,特定场景效果很好)
| # | 风格 | 适合场景 |
|---|---|---|
| 5 | Neo-Brutalism 新粗野主义 | 企业内训、线下技术分享、信息密集场合 |
| 6 | xkcd 白板手绘 | 技术分享、极客受众、课堂 |
| 7 | The Oatmeal 信息图漫画 | 科普、社交传播、内部培训 |
| 8 | 苏联构成主义 | Campaign、动员、品牌宣言 |
| 9 | 敦煌壁画 | 国风品牌、文化项目、高端场合 |
| 10 | 浮世绘 | 日本/东方市场、跨境品牌 |
第三梯队(可用,需合适场景)
| # | 风格 | 适合场景 |
|---|---|---|
| 11 | 温暖叙事 | 用户故事、品牌故事 |
| 12 | 孔版印刷 Risograph | 独立品牌、创意行业、音乐 |
| 13 | 等轴测 Isometric | 科技产品、SaaS 流程 |
| 14 | Bauhaus 包豪斯 | 设计行业、建筑、教育 |
| 15 | 工程蓝图 Blueprint | 技术架构、工程方案 |
| 16 | 复古广告 Vintage Ad | 消费品、零售、怀旧感 |
| 17 | 达达拼贴 Collage | 创意行业、广告、破冰 |
| 18 | 像素画 Pixel Art | 游戏、年轻群体、gamification |
专业编辑风格(Path A 专用)
这五种风格依赖精确排版和网格系统,必须走 HTML→PPTX 路径:
| 风格 | 适合场景 |
|---|---|
| Pentagram Editorial | 行业分析、咨询报告、数据驱动演示 |
| Fathom Data Narrative | 数据报告、科研汇报(Bloomberg 数据视觉风) |
| Müller-Brockmann 瑞士网格 | 培训课件、技术架构、流程说明 |
| Build Luxury Minimal | 投资路演、品牌高管汇报 |
| Takram Speculative 日式思辨 | 产品愿景、设计思维、战略规划 |
AI 插画机制
生成方式
插画调用 nano-banana-pro skill(底层是 Gemini 图像生成),统一 2K 分辨率(2048×1152),保证投影和高清屏都清晰。
生成命令格式:
export $(grep GEMINI_API_KEY ~/.claude/.env) && \
uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py \
--prompt "[描述]" \
--filename "[时间戳]-slide-[N]-[名称].png" \
--resolution 2K风格一致性的关键
Base Style 的作用:先定义一次”底色”(视觉参考、画布比例、色调氛围),然后每一页的 prompt 只描述”这页讲什么 + 观众应该感受到什么”——不重复描述风格细节。
反直觉的核心规则:短 prompt 比长 prompt 效果更好。30 行的详细约束(颜色比例、排版位置、角色姿势)会严重降低多样性,让每页看起来雷同;3-5 句描述情绪和内容的短 prompt,反而让 AI 生出有层次感的系列图。
与 PPT 的配合
- Path A(可编辑路径):插画以 PNG 嵌入 HTML,文字是独立的可编辑文本层。图片不包含文字(prompt 里始终写
no text in image),所有文字通过 CSS 叠加。 - Path B(全视觉路径):整页由 AI 生成,文字烘焙在图里——用
create_slides.py组装成 PPTX,每页是一张全屏图。
三类读者的典型用法
高校老师:课件备课
场景:经济学老师备新课,需要 20 页”供需曲线与价格机制”PPT。
风格选择逻辑:理工科课件适合 xkcd 白板手绘(精确、极客感、复杂概念秒懂)或 Neo-Brutalism(远距离投影可读,信息密度高);人文社科更适合 Snoopy 温暖漫画或温暖叙事(建立情感连接,降低抽象感)。
操作路径:把教材章节大纲粘给 AI → 选 Guided 模式 → 确认每页断言句标题(从”第三章 价格机制”改为”价格是分散信息的最优机制”)→ 选 xkcd 风格 → 拿到可编辑 PPTX,在 Keynote 里加动画。
效率提升点:以前耗时最长的是”把教材文字变成 PPT 逻辑”这一步,AI 直接完成结构化,老师只需审核断言句是否准确。
HR:培训材料与公司 VI
场景:新员工入职培训,需要符合公司 VI(蓝白主色调)的 30 页标准化材料。
关键能力:选 Pentagram Editorial 或 Build Luxury Minimal 风格,在 Step 0 选 Path A(HTML 路径),可以在 HTML 里精确指定公司色值(如主色 #1A56A8,辅助色 #FFFFFF),保证所有页面配色一致。字体选公司规定的字体族。
一致性保证:Path A 的 Base Style 定义一次就锁定整套配色系统,不会出现每页配色飘移的问题。后期 PPTX 里的文字可以直接双击修改,不影响视觉框架。
培训师 / 技术分享者
场景:工程师在技术 meetup 分享”LLM 应用架构”,需要 15 页,含代码截图和架构图。
风格选择:Neo-Brutalism 是强推荐——粗边框大字在会议室投影仪上 10 米外仍清晰;xkcd 白板手绘适合风格轻松的内部分享。信息密度平衡:代码页和架构图页走 Path A(可以直接嵌入截图,文字可读),概念解释页走 AI 插画。
实测数据:花叔用 Neo-Brutalism 跑了蕴煜 AI 培训项目,Day1 67 页 + Day2 64 页,HTML 渲染成功率接近 100%。粗边框+大字是关键,不依赖 AI 图片生成,纯 CSS 实现。
一个完整例子:HR 做新员工培训
输入:公司文化、价值观、组织架构大纲(一份 Word 文档)+ 要求符合公司蓝白 VI
Step 0:选 Guided 模式 + Path A(可编辑 HTML)
Step 1 输出(AI 生成大纲,HR 确认):
| # | 标题(断言句) | 要点 | 视觉类型 | 需要插画 |
|---|--------------------------|-------------|---------|---------|
| 1 | 欢迎加入:你选择了一家有使命的公司 | — | 封面插画 | 是:团队欢迎场景 |
| 2 | 我们相信:客户价值优先于短期利润 | 3 个价值观 | 图标+文字 | 否 |
| 3 | 你的第一周:3 件最重要的事 | 系统权限/导师/文化 | 步骤图 | 是:新人引路场景 |
Step 2:AI 推荐 Pentagram Editorial(符合商务 VI)、Neo-Brutalism(信息密度高)、Takram 日式思辨(温暖科技感)。HR 选 Pentagram Editorial,指定主色 #1A56A8。
Step 3:AI 生成封面插画(2K 分辨率,no text in image)+ 制作所有 HTML 幻灯片文件。
Step 4:一行命令组装:
node html2pptx.js slide-01.html slide-02.html ... -o 新员工培训2026.pptx结果:拿到可在 PowerPoint 打开的 .pptx,文字全部可双击编辑,公司 Logo 在 Keynote 里手动放进去,完成。整个过程从大纲到成品约 45 分钟(传统做法:2-3 天)。
和 data-pro 的分工
huashu-slides(slides skill)专注演示文稿成品——从内容到 PPTX 的完整链路。
data-pro skill 主线是数据分析,虽然也能产出 PPT,但核心能力在数据清洗、图表生成、分析报告。
两者配合:用 data-pro 出数据图表(折线图、热力图、散点图),再用 slides 把这些图表排进演示文稿。尤其是行业分析类 deck——数据层交给 data-pro,叙事和排版层交给 slides + Pentagram Editorial 风格。
怎么本地跑
花叔的 skill 依赖本地环境:
- Gemini API Key:存入
~/.claude/.env,GEMINI_API_KEY=xxx - nano-banana-pro skill:AI 插画生成底层工具(调用 Gemini 图像模型)
- image-to-slides skill:Path B 的
create_slides.py组装工具 - Node.js + pptxgenjs:Path A 的
html2pptx.js转换工具 - uv:Python 环境管理(花叔的所有脚本统一用 uv 运行)
在 Claude Code 里直接调用 huashu-slides skill,或者按 SKILL.md 的步骤手动执行各阶段。
关联条目
3-你能让-AI-成为什么/AI做数据分析与报告.md— data-pro skill,数据分析主线,和 slides 可配合出行业分析 deck3-你能让-AI-成为什么/AI配图方法论.md— “先提案后生成”原则在 PPT 插画中同样适用:先确认每页插画方向(Step 1 大纲),再生成(Step 3),避免批量返工