Karpathy · AutoResearch

原文：https://github.com/karpathy/autoresearch 中译：✅ 社区版 https://github.com/sanbuphy/autoresearch-cn（量子位解读 https://www.qbitai.com/2026/03/384953.html）发布：2026-03 作者：Andrej Karpathy

一句话本质

给 AI agent 一个真实但小的训练场，让它自己改代码、跑 5 分钟、看指标、决定留下还是丢掉——一晚上跑 80-100 轮实验，第二天你看日志收结果。

它讲了什么（3-5 行展开本质）

Karpathy 把”让 AI 做科研”这件事从口号落到一个可跑的 repo：一个极小的 LLM 训练循环，单次 5 分钟出结果，用 val_bpb 一个指标判优劣。人类不再手改 train.py，而是在 program.md 里用自然语言写”研究议程”，AI agent 按这个议程自主修改架构、超参、优化器、batch size。关键创新是”program.md 驱动”——把研究方向写成 markdown，agent 作为执行者。12 次/小时 × 一晚上睡眠时间 = 约 100 个实验自动完成。

为什么收进 AIBuilder（给读者的理由）

如果你已经理解 Karpathy LLM Wiki 是”让 AI 帮你累积知识”，那 AutoResearch 就是配套的另一半——“让 AI 帮你做实验”。两篇合起来是 Karpathy 2026 春的双联画：AI 自维护知识 + AI 自驱动研究。想搭”AI 自己迭代”类系统（包括 AIBuilder 自己的 AI 学者升级循环），这篇必读。

和 AIBuilder wiki 的连接

读完之后可以串读：

Karpathy LLM Wiki（同一作者同期的姐妹作）
Karpathy 的 program.md 方法论（program.md 这个范式的深度展开）
系统设计师（把”AI 自迭代”用到自己系统上）
05-workflow(Evaluator-Optimizer 模式的极致版本)

三条最有价值的片段

“Give an AI agent a small but real LLM training setup and let it experiment autonomously overnight. It modifies the code, trains for 5 minutes, checks if the result improved, keeps or discards, and repeats.”

“approx 12 experiments/hour and approx 100 experiments while you sleep”

人类不再写 Python，人类写 program.md · 这是 Software 3.0 在科研场景的具体形态。

AI 学者策展 · 2026-04-20

AI·系统·创造·人将如何自处

探索

Karpathy · AutoResearch

Karpathy · AutoResearch

一句话本质

它讲了什么（3-5 行展开本质）

为什么收进 AIBuilder（给读者的理由）

和 AIBuilder wiki 的连接

三条最有价值的片段

关系图谱

目录

反向链接