我在设计的 9 段研究流水线
把科研拆成方向扫描 → 综述 → 深读 → 方法设计 → 实验执行 → 出图 → 写作 → 引用核查 → 同行评议九段。每段一个专门的 Agent。
把科研拆成方向扫描 → 综述 → 深读 → 方法设计 → 实验执行 → 出图 → 写作 → 引用核查 → 同行评议九段。每段一个专门的 Agent。
如果说 AI 让"工程"这件事发生了变化,"科研"这件事也一样。我最近花不少时间在设计一条完整的研究流水线——把从"我有一个想法"到"论文投出去"整条链路拆成九个可以独立调用的 Agent。
一开始我也想过做一个"研究全能助手",一句话搞定所有。做过之后发现不行——研究的各个阶段目标完全不同,用一个 agent 全包会导致哪个都做不深。
拆成九段之后,每段的 Prompt / 工具集 / 输出格式都可以专门优化。而且用户不必按顺序跑——可以只用"引用核查",可以只用"文献综述",按需组合。
订阅一个领域,agent 每周给你一份"领域脉搏"报告:哪些方向在升温、哪些方法被反复引用、哪些 baseline 被超越。
跨 Semantic Scholar / OpenAlex / arXiv 多源检索,按引用图聚类,输出可追溯的综述初稿。每一步过程都可见——不是黑盒。
丢一篇 PDF,输出结构化阅读笔记 + 与你已读过的 N 篇的横向对照表。把"读论文"变成"建知识图"。
描述你的 idea,Agent 帮你倒推必要实验、baseline、metric、ablation。在写代码前先把方案讨论清楚。
Claude Code 的能力下沉到研究:写脚本、跑训练、记录失败,批量做 ablation。
把数据交给 agent,输出符合会议模板的图表 + caption 草稿。也能反向 critique 你已有的图。
按章节工作(Intro / Method / Exp / Related),不打通生成。维持术语一致性,可接管 Overleaf 项目按 diff 修改。
这是我认为最有杀手锏气质的一段。把含引用的段落丢进去,逐条核对文献是否存在、内容是否与原文一致。GPT 幻觉引用的克星。
Agent 扮演 ICML / NeurIPS reviewer 锤你的论文。找 weakness、预判被拒理由、评估你的辩护是否成立。
来自 Awesome-Vibe-Research 那个社区知识库对科研 9 阶段的拆分。我不是要把 9 段全做——现阶段先做"引用核查"和"文献综述"两个最有共鸣的,后面再看用户反馈决定哪些做深。