AI 配图方法论 · 先提案后生成(公众号 + 小红书)

你最可能犯的错

打开 ChatGPT 或 Claude,把文章标题一粘贴,直接说:“帮我配一张封面图。”

然后拿到一张图,看着不太对,再说”换个风格”,再一张,还是不对。反反复复三四次,最后随便用了一张,内心隐约觉得这图和文章对不上,但也说不清哪里不对。

这是绝大多数人用 AI 配图的方式,也是效率最低的方式。

问题不在工具,在流程。你跳过了最关键的一步——在出图之前,先把设计方向说清楚

核心原则

花叔在他的两个配图 Skill(小红书版和公众号版)里,开篇都是同一句话:

绝对不能跳过设计提案直接出图。 正确流程: 理解内容 → 设计提案(2-3个方向)→ 用户选择 → 生成 → 预览确认 → 上传

这不是使用习惯的问题,是方法论层面的判断。图和文案之间存在一个”审美对齐”的问题——AI 不知道你的文章想传递什么情绪,不知道你的账号是什么风格,不知道你想让读者看到图之后产生什么感受。如果你跳过提案、直接生成,AI 只能靠猜,猜出来的结果大概率不对味。

提案的本质是把隐性需求显性化:你知道自己的文章”有点硬核但想让人读进去”,但你没说;AI 出了一张冷峻的深蓝色图,而你其实想要的是温暖的手绘风。两边的落差,发生在提案缺席的那一步。

正确流程:五步走

Step 1 · 理解内容

先读文章,提炼三件事:这篇讲什么主题、哪些关键词/数字需要在视觉上突出、整体情绪是干货感还是温度感还是震撼感。

这一步 AI 可以自动完成,不需要你额外说明,但你需要知道 AI 在做这件事——因为你后面要对提案做判断。

Step 2 · 设计提案(必须等你选)

这是整个流程里最关键、也最容易被跳过的一步。

AI 应该给你展示 2-3 个方向,每个方向包含:风格描述、色彩方案、文案布局思路、情绪定位。方向之间必须有明确差异——不是”深色版”和”浅色版”,而是审美基因完全不同的两条路。

提案示例(以一篇”AI 工具测评”文章为例):

方向 A:手绘笔记风(推荐)

  • 视觉风格:奶油色方格纸底 + 毛笔书法大标题 + 手绘小图标
  • 色彩:底色 FDF6EC + 主色 D97706(暖橙)+ 强调圈线
  • 文案布局:“实测 7 天”做 200px 的 hero 元素,橙色高亮;“真的值吗”大字撑满上半区;右下角小印章
  • 情绪:像朋友分享使用心得,亲切、有温度

方向 B:暗金揭秘风

  • 视觉风格:深色磨砂底 + 金色大字 + 徽章装饰
  • 色彩:底色 1A1A1A + 主色 E2B714(金)+ 白色辅助
  • 文案布局:“7天实测结论”金色巨字撑满画面;上方”独家评测”金色徽章;下方副标题白色小字
  • 情绪:有分量感、内幕感,让人觉得看到了真实结论

两个方向都是同一篇文章,但传递的感受截然不同。看到提案之后,你才能做真实的判断。

Step 3 · 生成

你选定方向(或者说”A 和 B 混一下,颜色用 B,但风格要 A 那种质感”),AI 再去构建完整的 Prompt 并生成图片。

这时候 AI 已经知道你真正要的是什么,生成命中率大幅提升。

Step 4 · 预览确认

生成后必须检查四件事:中文文字有没有渲染错误、比例是否符合平台规范、风格是否和选定方向一致、有没有出现署名或水印。

如果文字渲染有问题(这是 AI 生成的常见故障),可以切换到 HTML 渲染路径精确控制文字。

Step 5 · 上传图床

公众号文章的图片必须上传到图床获取永久链接,本地路径在发布后会失效。

公众号 vs 小红书:不是同一件事

两个平台的配图,差异比你想象的大。

尺寸完全不同:

小红书的主力尺寸是 3:4 竖版(1080×1440px)——因为小红书原生是手机竖屏浏览,竖版图在信息流里占屏面积比横版大 40%,停留时间更长。

公众号封面是 2.35:1 超宽横版(1800×766px),这是为了适配订阅号列表的展示方式。正文配图则用 16:9 或 4:3。两个平台的图,格式上没有复用可能。

生成路径的侧重不同:

小红书默认 AI 生成,只有精确数据表格才用 HTML 兜底。原因很直接:花叔的审美画像里明确写着”HTML 截图太平面、像 PPT 模板、没有灵魂”。

公众号则给出了更完整的双路径选择:

Path A · HTML 渲染Path B · AI 生成
文字准确度100%,代码控制中文可能出错
视觉创意中(靠设计能力)高(AI 有创造力)
API 成本零,纯本地消耗 Gemini API
适合场景文字多、数据多、信息图封面、氛围图、创意插画

公众号的全套配图甚至有”混合路径”:封面用 AI 生成抓眼球,正文数据图用 HTML 渲染保证文字精确,正文氛围图再回到 AI 生成。

审美画像机制(小红书版特有):

花叔在 xhs-image skill 里内置了一套”花叔设计审美画像”,明确列出他喜欢和不喜欢的视觉元素。

喜欢的:纸张褶皱、手写笔触、印章、手绘/书法字体、暖色调(奶油色、暖橙、暖金)、文字撑满画面。

不喜欢的:HTML 截图风格、赛博霓虹/深蓝底(#0D1117 是审美禁区)、署名/水印、过度留白。

这个审美画像不是说给用户看的建议,而是 AI 内置的判断标准——AI 在做提案时,会主动往这个方向靠。这解决了一个很实际的问题:你不需要每次都告诉 AI “不要 PPT 风格”,因为规则已经写进了 skill 本身。

和其他路子相比

卡兹克的写作 skill 系列走的是文字向——从草稿到打磨到发布,全是在文字本身做功夫。花叔的配图 skill 走的是视觉向——从审美判断到提案到生成,解决的是图和文的匹配问题。两个方向互补,不冲突。

来源

花叔 huashu-xhs-image Skill(/Users/chenbin/Documents/Personal Kingdom/知识库/素材_AI使用/人物/花叔/github-mirror/huashu-skills/huashu-xhs-image/)+ 花叔 huashu-wechat-image Skill(/Users/chenbin/Documents/Personal Kingdom/知识库/素材_AI使用/人物/花叔/github-mirror/huashu-skills/huashu-wechat-image/