AI 配图方法论 · 先提案后生成(公众号 + 小红书)
你最可能犯的错
打开 ChatGPT 或 Claude,把文章标题一粘贴,直接说:“帮我配一张封面图。”
然后拿到一张图,看着不太对,再说”换个风格”,再一张,还是不对。反反复复三四次,最后随便用了一张,内心隐约觉得这图和文章对不上,但也说不清哪里不对。
这是绝大多数人用 AI 配图的方式,也是效率最低的方式。
问题不在工具,在流程。你跳过了最关键的一步——在出图之前,先把设计方向说清楚。
核心原则
花叔在他的两个配图 Skill(小红书版和公众号版)里,开篇都是同一句话:
绝对不能跳过设计提案直接出图。 正确流程:
理解内容 → 设计提案(2-3个方向)→ 用户选择 → 生成 → 预览确认 → 上传
这不是使用习惯的问题,是方法论层面的判断。图和文案之间存在一个”审美对齐”的问题——AI 不知道你的文章想传递什么情绪,不知道你的账号是什么风格,不知道你想让读者看到图之后产生什么感受。如果你跳过提案、直接生成,AI 只能靠猜,猜出来的结果大概率不对味。
提案的本质是把隐性需求显性化:你知道自己的文章”有点硬核但想让人读进去”,但你没说;AI 出了一张冷峻的深蓝色图,而你其实想要的是温暖的手绘风。两边的落差,发生在提案缺席的那一步。
正确流程:五步走
Step 1 · 理解内容
先读文章,提炼三件事:这篇讲什么主题、哪些关键词/数字需要在视觉上突出、整体情绪是干货感还是温度感还是震撼感。
这一步 AI 可以自动完成,不需要你额外说明,但你需要知道 AI 在做这件事——因为你后面要对提案做判断。
Step 2 · 设计提案(必须等你选)
这是整个流程里最关键、也最容易被跳过的一步。
AI 应该给你展示 2-3 个方向,每个方向包含:风格描述、色彩方案、文案布局思路、情绪定位。方向之间必须有明确差异——不是”深色版”和”浅色版”,而是审美基因完全不同的两条路。
提案示例(以一篇”AI 工具测评”文章为例):
方向 A:手绘笔记风(推荐)
- 视觉风格:奶油色方格纸底 + 毛笔书法大标题 + 手绘小图标
- 色彩:底色 FDF6EC + 主色 D97706(暖橙)+ 强调圈线
- 文案布局:“实测 7 天”做 200px 的 hero 元素,橙色高亮;“真的值吗”大字撑满上半区;右下角小印章
- 情绪:像朋友分享使用心得,亲切、有温度
方向 B:暗金揭秘风
两个方向都是同一篇文章,但传递的感受截然不同。看到提案之后,你才能做真实的判断。
Step 3 · 生成
你选定方向(或者说”A 和 B 混一下,颜色用 B,但风格要 A 那种质感”),AI 再去构建完整的 Prompt 并生成图片。
这时候 AI 已经知道你真正要的是什么,生成命中率大幅提升。
Step 4 · 预览确认
生成后必须检查四件事:中文文字有没有渲染错误、比例是否符合平台规范、风格是否和选定方向一致、有没有出现署名或水印。
如果文字渲染有问题(这是 AI 生成的常见故障),可以切换到 HTML 渲染路径精确控制文字。
Step 5 · 上传图床
公众号文章的图片必须上传到图床获取永久链接,本地路径在发布后会失效。
公众号 vs 小红书:不是同一件事
两个平台的配图,差异比你想象的大。
尺寸完全不同:
小红书的主力尺寸是 3:4 竖版(1080×1440px)——因为小红书原生是手机竖屏浏览,竖版图在信息流里占屏面积比横版大 40%,停留时间更长。
公众号封面是 2.35:1 超宽横版(1800×766px),这是为了适配订阅号列表的展示方式。正文配图则用 16:9 或 4:3。两个平台的图,格式上没有复用可能。
生成路径的侧重不同:
小红书默认 AI 生成,只有精确数据表格才用 HTML 兜底。原因很直接:花叔的审美画像里明确写着”HTML 截图太平面、像 PPT 模板、没有灵魂”。
公众号则给出了更完整的双路径选择:
| Path A · HTML 渲染 | Path B · AI 生成 | |
|---|---|---|
| 文字准确度 | 100%,代码控制 | 中文可能出错 |
| 视觉创意 | 中(靠设计能力) | 高(AI 有创造力) |
| API 成本 | 零,纯本地 | 消耗 Gemini API |
| 适合场景 | 文字多、数据多、信息图 | 封面、氛围图、创意插画 |
公众号的全套配图甚至有”混合路径”:封面用 AI 生成抓眼球,正文数据图用 HTML 渲染保证文字精确,正文氛围图再回到 AI 生成。
审美画像机制(小红书版特有):
花叔在 xhs-image skill 里内置了一套”花叔设计审美画像”,明确列出他喜欢和不喜欢的视觉元素。
喜欢的:纸张褶皱、手写笔触、印章、手绘/书法字体、暖色调(奶油色、暖橙、暖金)、文字撑满画面。
不喜欢的:HTML 截图风格、赛博霓虹/深蓝底(#0D1117 是审美禁区)、署名/水印、过度留白。
这个审美画像不是说给用户看的建议,而是 AI 内置的判断标准——AI 在做提案时,会主动往这个方向靠。这解决了一个很实际的问题:你不需要每次都告诉 AI “不要 PPT 风格”,因为规则已经写进了 skill 本身。
和其他路子相比
卡兹克的写作 skill 系列走的是文字向——从草稿到打磨到发布,全是在文字本身做功夫。花叔的配图 skill 走的是视觉向——从审美判断到提案到生成,解决的是图和文的匹配问题。两个方向互补,不冲突。
来源
花叔 huashu-xhs-image Skill(/Users/chenbin/Documents/Personal Kingdom/知识库/素材_AI使用/人物/花叔/github-mirror/huashu-skills/huashu-xhs-image/)+ 花叔 huashu-wechat-image Skill(/Users/chenbin/Documents/Personal Kingdom/知识库/素材_AI使用/人物/花叔/github-mirror/huashu-skills/huashu-wechat-image/)