Anthropic · Claude’s Constitution 2026
原文入口:https://www.anthropic.com/constitution 更新说明:https://www.anthropic.com/news/claude-new-constitution 中译情况:暂无权威中译 发布日期:2026-01-22 作者:Anthropic
一句话本质
这不是一份“给人看的公司声明”,而是给模型看的行为宪章。Anthropic 这次把写法从“规则条目”推向“带理由的原则”,核心变化是:不是只说做什么,也开始解释为什么要这么做。
为什么值得读
如果你想理解 AI 公司到底怎么把“安全、伦理、可用”揉进训练和产品,这篇比任何二手解读都直接。它展示的不是抽象的对齐口号,而是一个模型该如何理解自己所处世界的具体框架。
这篇主要在回答什么问题
- AI 的对齐规则为什么不能只写成硬条款?
- 为什么 Anthropic 这次强调“理由型”而不是“规则型”?
- 模型的“帮助性”为什么必须和安全、伦理、指南并列看?
和 AIBuilder 的串读
适合谁先读 / 谁可以后读
先读:想看 AI 公司如何把对齐原则写进模型骨架的人。
后读:已经理解 agent/workflow 基础,想进一步看“模型价值观怎么被制度化”的读者。