AI 做 PPT · 18 种风格 + AI 插画 + 端到端产出

来源:花叔 huashu-slides skill · 公众号「花叔」· 30万+粉丝 · AI工具与效率提升


痛点:讲话 1 小时,做 PPT 5 小时

PPT 最让人崩溃的不是”不知道讲什么”,是找配图、对齐元素、配色、凑字数这些无意义的体力活。

教授备一门新课,得花整周末排课件;HR 做培训材料,得反复和设计部拉锯;培训师做分享 deck,光素材授权和排版就耗掉大半天。讲话的内容早想好了,浪费的时间全在”让它好看”上。

AI 能接管这条链路——从大纲到风格选择,从插画生成到 PPTX 导出,全流程一次跑通,拿到可在 PowerPoint/Keynote 打开的成品文件


开始前的两个选择(Step 0)

花叔的 skill 在每次开始前强制问两个问题,定好工作模式。

0-A · 协作模式

模式说明检查点
Full Auto 全自动最少交互,只确认主题,直接交付 PPTX1 个
Guided 引导(默认推荐)确认大纲、选风格、预览后再组装3 个
Collaborative 协作每页逐一确认,每张插画逐一审批每页一次

0-B · 组装方式

方式原理适合场景
Path A · 可编辑 HTMLHTML 幻灯片 + 选择性 AI 插画 → html2pptx → 可编辑 PPTX需要后期改文字、精确排版、企业 deck
Path B · 全 AI 视觉每页整张 AI 生成图片 → create_slides.py → 图片 PPTX视觉冲击最大、艺术演示、快速原型

两种路径的核心区别:Path A 的文字在 PPT 里可以直接双击修改;Path B 的文字烘焙进图片,视觉效果更震撼但不可单独编辑。 不指定时,默认走 Path A。


完整工作流(5 个阶段)

这是 huashu-slides skill 的原始结构:

Content → Design → Build → Assembly → Polish

Step 1 · Content Structuring:把原始素材转化为逐页大纲。每页定义标题(用断言句而非主题词)、3-4 个要点、视觉类型、是否需要插画。

Step 2 · Design System:从 18 种风格里推荐 3 个,用户选一个。关键:设计系统不只是配色——它定义视觉哲学、字体比例、构图规则和情感基调。

Step 3 · Build Slides:Path A 生成 AI 插画 + 制作 HTML 幻灯片;Path B 生成每页完整 AI 图片。

Step 4 · PPTX Assembly:Path A 用 html2pptx 转换;Path B 用 create_slides.py 拼装。

Step 5 · Preview & Polish:预览关键页面,在 Keynote/PowerPoint 里做最终调整(动画、备注、Logo)。


18 种设计风格清单

花叔经过实战验证(2026年小红书介绍 PPT 项目:同一份大纲在 17 种风格下全部一次生成成功),整理出完整的风格体系,共 18 种 + 5 种专业编辑风格。

第一梯队(强烈推荐,AI 生成效果最好)

#风格适合场景
1Snoopy 温暖漫画品牌介绍、教育课件、个人 IP
2学習漫画 Manga教程、培训、知识分享
3Ligne Claire 清线漫画产品说明、流程解释(信息清晰度最高)
4Neo-Pop 新波普年轻品牌、社交平台、活动发布

核心洞察:插画/漫画类风格的 AI 生成效果远好于”专业极简”风格。有明确视觉语言(线条、角色、色块)的风格,AI 能充分发挥;纯极简风格(暗色底+大留白)生成出来”空”且”平”。

第二梯队(推荐,特定场景效果很好)

#风格适合场景
5Neo-Brutalism 新粗野主义企业内训、线下技术分享、信息密集场合
6xkcd 白板手绘技术分享、极客受众、课堂
7The Oatmeal 信息图漫画科普、社交传播、内部培训
8苏联构成主义Campaign、动员、品牌宣言
9敦煌壁画国风品牌、文化项目、高端场合
10浮世绘日本/东方市场、跨境品牌

第三梯队(可用,需合适场景)

#风格适合场景
11温暖叙事用户故事、品牌故事
12孔版印刷 Risograph独立品牌、创意行业、音乐
13等轴测 Isometric科技产品、SaaS 流程
14Bauhaus 包豪斯设计行业、建筑、教育
15工程蓝图 Blueprint技术架构、工程方案
16复古广告 Vintage Ad消费品、零售、怀旧感
17达达拼贴 Collage创意行业、广告、破冰
18像素画 Pixel Art游戏、年轻群体、gamification

专业编辑风格(Path A 专用)

这五种风格依赖精确排版和网格系统,必须走 HTML→PPTX 路径:

风格适合场景
Pentagram Editorial行业分析、咨询报告、数据驱动演示
Fathom Data Narrative数据报告、科研汇报(Bloomberg 数据视觉风)
Müller-Brockmann 瑞士网格培训课件、技术架构、流程说明
Build Luxury Minimal投资路演、品牌高管汇报
Takram Speculative 日式思辨产品愿景、设计思维、战略规划

AI 插画机制

生成方式

插画调用 nano-banana-pro skill(底层是 Gemini 图像生成),统一 2K 分辨率(2048×1152),保证投影和高清屏都清晰。

生成命令格式:

export $(grep GEMINI_API_KEY ~/.claude/.env) && \
uv run ~/.claude/skills/nano-banana-pro/scripts/generate_image.py \
  --prompt "[描述]" \
  --filename "[时间戳]-slide-[N]-[名称].png" \
  --resolution 2K

风格一致性的关键

Base Style 的作用:先定义一次”底色”(视觉参考、画布比例、色调氛围),然后每一页的 prompt 只描述”这页讲什么 + 观众应该感受到什么”——不重复描述风格细节。

反直觉的核心规则:短 prompt 比长 prompt 效果更好。30 行的详细约束(颜色比例、排版位置、角色姿势)会严重降低多样性,让每页看起来雷同;3-5 句描述情绪和内容的短 prompt,反而让 AI 生出有层次感的系列图。

与 PPT 的配合

  • Path A(可编辑路径):插画以 PNG 嵌入 HTML,文字是独立的可编辑文本层。图片不包含文字(prompt 里始终写 no text in image),所有文字通过 CSS 叠加。
  • Path B(全视觉路径):整页由 AI 生成,文字烘焙在图里——用 create_slides.py 组装成 PPTX,每页是一张全屏图。

三类读者的典型用法

高校老师:课件备课

场景:经济学老师备新课,需要 20 页”供需曲线与价格机制”PPT。

风格选择逻辑:理工科课件适合 xkcd 白板手绘(精确、极客感、复杂概念秒懂)或 Neo-Brutalism(远距离投影可读,信息密度高);人文社科更适合 Snoopy 温暖漫画或温暖叙事(建立情感连接,降低抽象感)。

操作路径:把教材章节大纲粘给 AI → 选 Guided 模式 → 确认每页断言句标题(从”第三章 价格机制”改为”价格是分散信息的最优机制”)→ 选 xkcd 风格 → 拿到可编辑 PPTX,在 Keynote 里加动画。

效率提升点:以前耗时最长的是”把教材文字变成 PPT 逻辑”这一步,AI 直接完成结构化,老师只需审核断言句是否准确。

HR:培训材料与公司 VI

场景:新员工入职培训,需要符合公司 VI(蓝白主色调)的 30 页标准化材料。

关键能力:选 Pentagram Editorial 或 Build Luxury Minimal 风格,在 Step 0 选 Path A(HTML 路径),可以在 HTML 里精确指定公司色值(如主色 #1A56A8,辅助色 #FFFFFF),保证所有页面配色一致。字体选公司规定的字体族。

一致性保证:Path A 的 Base Style 定义一次就锁定整套配色系统,不会出现每页配色飘移的问题。后期 PPTX 里的文字可以直接双击修改,不影响视觉框架。

培训师 / 技术分享者

场景:工程师在技术 meetup 分享”LLM 应用架构”,需要 15 页,含代码截图和架构图。

风格选择:Neo-Brutalism 是强推荐——粗边框大字在会议室投影仪上 10 米外仍清晰;xkcd 白板手绘适合风格轻松的内部分享。信息密度平衡:代码页和架构图页走 Path A(可以直接嵌入截图,文字可读),概念解释页走 AI 插画。

实测数据:花叔用 Neo-Brutalism 跑了蕴煜 AI 培训项目,Day1 67 页 + Day2 64 页,HTML 渲染成功率接近 100%。粗边框+大字是关键,不依赖 AI 图片生成,纯 CSS 实现。


一个完整例子:HR 做新员工培训

输入:公司文化、价值观、组织架构大纲(一份 Word 文档)+ 要求符合公司蓝白 VI

Step 0:选 Guided 模式 + Path A(可编辑 HTML)

Step 1 输出(AI 生成大纲,HR 确认):

| # | 标题(断言句)              | 要点          | 视觉类型 | 需要插画 |
|---|--------------------------|-------------|---------|---------|
| 1 | 欢迎加入:你选择了一家有使命的公司 | —           | 封面插画 | 是:团队欢迎场景 |
| 2 | 我们相信:客户价值优先于短期利润   | 3 个价值观    | 图标+文字 | 否 |
| 3 | 你的第一周:3 件最重要的事      | 系统权限/导师/文化 | 步骤图   | 是:新人引路场景 |

Step 2:AI 推荐 Pentagram Editorial(符合商务 VI)、Neo-Brutalism(信息密度高)、Takram 日式思辨(温暖科技感)。HR 选 Pentagram Editorial,指定主色 #1A56A8

Step 3:AI 生成封面插画(2K 分辨率,no text in image)+ 制作所有 HTML 幻灯片文件。

Step 4:一行命令组装:

node html2pptx.js slide-01.html slide-02.html ... -o 新员工培训2026.pptx

结果:拿到可在 PowerPoint 打开的 .pptx,文字全部可双击编辑,公司 Logo 在 Keynote 里手动放进去,完成。整个过程从大纲到成品约 45 分钟(传统做法:2-3 天)。


和 data-pro 的分工

huashu-slides(slides skill)专注演示文稿成品——从内容到 PPTX 的完整链路。

data-pro skill 主线是数据分析,虽然也能产出 PPT,但核心能力在数据清洗、图表生成、分析报告。

两者配合:用 data-pro 出数据图表(折线图、热力图、散点图),再用 slides 把这些图表排进演示文稿。尤其是行业分析类 deck——数据层交给 data-pro,叙事和排版层交给 slides + Pentagram Editorial 风格。


怎么本地跑

花叔的 skill 依赖本地环境:

  1. Gemini API Key:存入 ~/.claude/.envGEMINI_API_KEY=xxx
  2. nano-banana-pro skill:AI 插画生成底层工具(调用 Gemini 图像模型)
  3. image-to-slides skill:Path B 的 create_slides.py 组装工具
  4. Node.js + pptxgenjs:Path A 的 html2pptx.js 转换工具
  5. uv:Python 环境管理(花叔的所有脚本统一用 uv 运行)

在 Claude Code 里直接调用 huashu-slides skill,或者按 SKILL.md 的步骤手动执行各阶段。


关联条目

  • 3-你能让-AI-成为什么/AI做数据分析与报告.md — data-pro skill,数据分析主线,和 slides 可配合出行业分析 deck
  • 3-你能让-AI-成为什么/AI配图方法论.md — “先提案后生成”原则在 PPT 插画中同样适用:先确认每页插画方向(Step 1 大纲),再生成(Step 3),避免批量返工