前阵子开源了 Video Studio Skills 之后,我又顺手做了一个“姊妹项目”:Novel Studio Skills 。
这是一个面向 Claude Code 、Codex、Hermes Agent 等工具的多 Agent 网络小说创作技能包。简单来说,它能让你用六个 AI Agent 组成一个虚拟的小说工作室,从立项、世界观、大纲、设定卡,一路写到正文、定稿和封面插画。你只需要丢给它一个大致的梗概创意。
为什么要给写小说也做条流水线
把视频做成流水线,大家可能都能理解:视频本来就是研究、脚本、配音、剪辑分工明确的活儿。但写小说听起来是个很“整体”的事情,为什么也要拆?
因为我自己用单个大模型写过长篇,踩过几个很典型的坑:
- 越写越飘。开头还记得主角左手有道疤,写到第三十章这道疤就不知道跑哪去了。设定、人名、地名,写着写着就开始自相矛盾。
- 一次写太长就崩。你让模型“接着往下写”,它要么糊弄几段草草收尾,要么上下文塞满之后开始遗忘前情。
- 浓浓的 AI 味。和写视频脚本一样,模型写正文也特别喜欢堆砌华丽的排比和宏大的形容词,读起来很假。
这些坑,本质上都是“一个脑子既要管全局设定,又要管这一段怎么写”带来的。所以我想试试:能不能像视频那样,把小说创作拆成几个各管一摊的角色,让它们通过文件来交接,而不是全靠一个对话上下文硬扛。
六个 Agent,各管一摊
在这个项目里,我把小说创作拆成了六个角色:
- 总编(Chief Editor):工作室的大管家。负责接收你的创意、编制实施计划、推进流程、分阶段向你汇报,最后做终验交付。
- 架构师(Architect):负责打地基。世界观设定、故事梗概、章节大纲都出自它手。
- 设定师(Lore Master):把抽象设定落成一张张“卡牌”——人物卡、场景卡、关键道具卡、关键情节卡,给后面写正文的人当字典查。
- 写手(Writer):分批起草正文初稿。
- 编辑(Editor):润色加工,并且对照梗概和设定卡逐项做一致性核对。
- 设计师(Designer):产出封面、角色立绘和关键情节插画的文生图提示词与规格。
它们之上还有一个所有人共享的“宪法”——总控技能 novel-studio,里面定义了整条流水线的状态机、项目目录规范、分批规则和质量门禁。所有协作都通过项目工作区里的文件来交接,project.yaml 记录当前进度,所以哪怕你今天写五章、下周再接着写,它也能从断点恢复。
“强制分批”这条铁律
如果说视频项目里我最在意的是“去 AI 润色”,那小说项目里我花心思最多的,是强制分批这件事。
长篇小说动辄几十上百章,如果放任模型“一口气写完”,结果一定是后半段质量断崖式下跌。所以我在流程里加了一条铁律:默认每批只写 5 章,写完必须停下来,由总编汇总这一批的成果向你汇报,等你确认之后再开下一批。
这么做有两个好处。一是把质量风险切成了小块——哪批不满意,就重跑那一批,不用从头来过。二是天然适配 Agent 会“失忆”的现实:每批结束都会生成滚动摘要和设定索引,下一批开工时先读这些压缩后的记忆,而不是去翻几万字的原文。
为了对抗前面说的“越写越飘”,我还设了三道一致性关卡:设定卡里的命名一旦冻结就不许改 → 写手交稿前先自查 → 编辑再做两轮对照复核。三道关下来,主角左手那道疤基本就跑不掉了。
一点感想
做完视频工作室再做这个,我越发觉得:多 Agent 协作真正解决的,不是“让 AI 更聪明”,而是“让 AI 别在长流程里把自己绕晕”。
单个模型的上限其实很高,但你要让它独自扛完一部长篇,它就会在全局和细节之间反复横跳,顾此失彼。而把任务拆开、用文件当交接界面之后,每个 Agent 每次只需要专注一件小事,反倒更稳。
当然,它替代不了真正的好故事。设定再自洽、流程再顺滑,最终能不能打动人,还是取决于你最初塞给它的那个创意,以及你愿不愿意在它写歪的时候停下来,亲手把它掰回正轨。
如果你也想给自己搭一个小说工作室,欢迎去仓库翻翻代码,把它装进你的 Claude Code 或 Hermes Agent 里试试。
