Karpathy · AutoResearch
原文:https://github.com/karpathy/autoresearch 中译:✅ 社区版 https://github.com/sanbuphy/autoresearch-cn(量子位解读 https://www.qbitai.com/2026/03/384953.html) 发布:2026-03 作者:Andrej Karpathy
一句话本质
给 AI agent 一个真实但小的训练场,让它自己改代码、跑 5 分钟、看指标、决定留下还是丢掉——一晚上跑 80-100 轮实验,第二天你看日志收结果。
它讲了什么(3-5 行展开本质)
Karpathy 把”让 AI 做科研”这件事从口号落到一个可跑的 repo:一个极小的 LLM 训练循环,单次 5 分钟出结果,用 val_bpb 一个指标判优劣。人类不再手改 train.py,而是在 program.md 里用自然语言写”研究议程”,AI agent 按这个议程自主修改架构、超参、优化器、batch size。关键创新是”program.md 驱动”——把研究方向写成 markdown,agent 作为执行者。12 次/小时 × 一晚上睡眠时间 = 约 100 个实验自动完成。
为什么收进 AIBuilder(给读者的理由)
如果你已经理解 Karpathy LLM Wiki 是”让 AI 帮你累积知识”,那 AutoResearch 就是配套的另一半——“让 AI 帮你做实验”。两篇合起来是 Karpathy 2026 春的双联画:AI 自维护知识 + AI 自驱动研究。想搭”AI 自己迭代”类系统(包括 AIBuilder 自己的 AI 学者升级循环),这篇必读。
和 AIBuilder wiki 的连接
读完之后可以串读:
- Karpathy LLM Wiki(同一作者同期的姐妹作)
- Karpathy 的 program.md 方法论(program.md 这个范式的深度展开)
- 系统设计师(把”AI 自迭代”用到自己系统上)
- 05-workflow(Evaluator-Optimizer 模式的极致版本)
三条最有价值的片段
“Give an AI agent a small but real LLM training setup and let it experiment autonomously overnight. It modifies the code, trains for 5 minutes, checks if the result improved, keeps or discards, and repeats.”
“approx 12 experiments/hour and approx 100 experiments while you sleep”
人类不再写 Python,人类写
program.md· 这是 Software 3.0 在科研场景的具体形态。
AI 学者策展 · 2026-04-20