研究 · Experiment Runner · 2026-06-02

描述实验,自动跑 + 记 + 出图

一句自然语言描述:训练目标、数据集、消融维度。Claude Code 写脚本、跑训练、自动记录 loss / metric / 失败,最后画图。下班离开桌面,第二天看结果。

> "跑 ResNet18 在 CIFAR-10 上,扫 lr ∈ {1e-3, 3e-4, 1e-4}"

→ generated train.py + sweep.yaml

→ launching 3 runs on local GPU...

→ logging to runs/2026-06-28/

✓ best: lr=3e-4 @ 92.7% · figs/sweep.png saved

"我想验证一个小 hypothesis"和"我已经写好实验代码"之间,存在一段 30~60 分钟的手动开销。这段没智力挑战,但需要写 boilerplate:数据加载、训练循环、metric 记录、画图。

Agent 把这段折叠掉了

我给一句话:训什么模型、什么数据、扫什么超参。Agent 生成 train.py、sweep.yaml,启动 3 个进程并行跑,自动把 loss/metric 写进结构化目录。等我回来看结果时,图已经画好了。

想清楚:研究的核心是"该跑什么实验"和"怎么解读结果",这两块 AI 没有替代。它替代的是"实现实验"这段——那部分本来也是任何博士生第一学期就掌握的事,让机器做正合适。