Karpathy · AutoResearch

原文https://github.com/karpathy/autoresearch 中译:✅ 社区版 https://github.com/sanbuphy/autoresearch-cn(量子位解读 https://www.qbitai.com/2026/03/384953.html发布:2026-03 作者:Andrej Karpathy

一句话本质

给 AI agent 一个真实但小的训练场,让它自己改代码、跑 5 分钟、看指标、决定留下还是丢掉——一晚上跑 80-100 轮实验,第二天你看日志收结果。

它讲了什么(3-5 行展开本质)

Karpathy 把”让 AI 做科研”这件事从口号落到一个可跑的 repo:一个极小的 LLM 训练循环,单次 5 分钟出结果,用 val_bpb 一个指标判优劣。人类不再手改 train.py,而是在 program.md 里用自然语言写”研究议程”,AI agent 按这个议程自主修改架构、超参、优化器、batch size。关键创新是”program.md 驱动”——把研究方向写成 markdown,agent 作为执行者。12 次/小时 × 一晚上睡眠时间 = 约 100 个实验自动完成。

为什么收进 AIBuilder(给读者的理由)

如果你已经理解 Karpathy LLM Wiki 是”让 AI 帮你累积知识”,那 AutoResearch 就是配套的另一半——“让 AI 帮你做实验”。两篇合起来是 Karpathy 2026 春的双联画:AI 自维护知识 + AI 自驱动研究。想搭”AI 自己迭代”类系统(包括 AIBuilder 自己的 AI 学者升级循环),这篇必读。

和 AIBuilder wiki 的连接

读完之后可以串读:

三条最有价值的片段

“Give an AI agent a small but real LLM training setup and let it experiment autonomously overnight. It modifies the code, trains for 5 minutes, checks if the result improved, keeps or discards, and repeats.”

“approx 12 experiments/hour and approx 100 experiments while you sleep”

人类不再写 Python,人类写 program.md · 这是 Software 3.0 在科研场景的具体形态。


AI 学者策展 · 2026-04-20