⚠️ 源单薄性声明 本条目主要基于 4 份来源:Anthropic 官方 doc 2 份、花叔 Opus 4.7 橙书、Boris 推特。全部来自 Claude 阵营内视角。 已讲清楚:Claude 家族各型号定位 / Opus 4.7 核心特性 / Boris 用哪个 还没听到:独立第三方横评、GPT/Gemini 视角、国产模型实测、真实踩坑案例 视为”Claude 用户自述”而非业界共识。

⚠️ 时效性提醒 模型版本和价格 3 个月内大概率变。本条目建议每季度 review 一次,重大版本发布时触发临时更新。

三层家族

来源:claude-code-docs/overview.md + 橙书 10 第 1 章。

型号定位(Anthropic 自述)典型用途
Opus 4.7最强、最贵、最慢重要代码、复杂推理、agentic 循环
Sonnet 4.x平衡款日常对话、中等任务(Claude Code 默认模型)
Haiku 4.5便宜、快批处理、分类、简单提取

Opus 4.7 的三个关键点(橙书 10)

花叔橙书 10 全本讲 Opus 4.7 的 System Card 中文版。从中读出的核心观察:

1. Agentic 能力是主要突破

Opus 4.7 对比 Opus 4.6 最显著的进步在多步工具循环:读工具返回 → 判断 → 再调工具 → 修正。橙书 10 多次强调:单轮回答强度提升有限,但连续 10-20 步工具调用的准确性明显提高。

2. Extended Thinking

Opus 4.7 默认支持 thinking 模式——在回答前先”思考”(消耗额外 token,但答案质量明显提升)。Boris tip 3 明确说:

“Opus 4.5 with thinking mode for everything.”

注:Boris 2026-01 用的是 Opus 4.5,本 wiki 写作时(2026-04-18)Opus 4.7 已上。Boris 的做法原则仍适用:重要任务开 thinking

3. 上下文窗口和成本

橙书 10 第 3 章数字(Anthropic 官方口径):Opus 4.7 对比 Opus 4.6 在相同任务上总 token 消耗降低约 15%——原因是少返工。但单 token 价格更贵,实际账单平衡点要看任务类型

三档选型规则(Boris tip 3 + 橙书 10 交叉提炼)

规则 1 — 重要 = Opus 重要代码、关键决策——用 Opus。返工时间比多付的钱贵。

规则 2 — 批处理 = Haiku 数据清洗、分类、简单提取——用 Haiku。10 倍便宜、几乎一样准。

规则 3 — agentic 循环 = Opus Boris 原话(tip 3):

“since you have to steer it less and it’s better at tool use, it is almost always faster than using a smaller model in the end.” 多步工具循环里小模型容易出错要返工,大模型总成本反而低。

反常识:最新模型不总值得立即换

根据 best-practices.mdoverview.md 的措辞、结合 Boris 实际用法的时间线(2026-01 他还在用 4.5),可以观察到一个规律:

新模型刚出那周:价格最高、API 未稳定、尚未被 prompt 模板充分优化 2-4 周后:价格稳、bug 修、社群给出实战报告

除非你的工作严重依赖新模型的某个具体能力(如 Opus 4.7 的 agentic 突破),否则等 2-4 周再换。

本条目没覆盖的

GPT 家族、Gemini、国产模型(MiniMax / Kimi / DeepSeek / 智谱)——素材不够,单独条目更合适。列在 P1 批次:

  • OpenAI 家族全景(待补源)
  • Google Gemini 家族(待补源)
  • 国产模型矩阵(陈彬主笔,P2 批)

诚实说:本 wiki 当前对”非 Claude”模型的覆盖是严重单边的——这是个漏洞,不是”业界就是这样”。

陈彬视角

“选模型”和”选立场”容易混。很多人选 Claude 不是因为评测结果,是因为 Anthropic 的对齐价值观、或者开发者社群氛围。这本身没问题——但要诚实承认这是立场选择,不是性能选择

另一个观察:非程序员用户不要过度关心”哪个模型最强”。对 80% 的日常任务,Opus 4.6 / 4.7 / Sonnet 4.x 的差别你感受不到。真正影响体验的是你的 prompt / CLAUDE.md / 工作流设计——这些事模型差异解决不了。

关联

needs_sources(明确待补)

  • 独立第三方 Claude 评测(非 Anthropic 阵营)
  • Claude vs GPT-5 vs Gemini 3 横评
  • 国产模型实测对比
  • 每季度价格更新