科技分享 | Mason's Blog

上线了一个多 Agent 视频创作技能包

最近开源了一个新项目：Video Studio Skills 。这是一个面向 Hermes Agent 的多 Agent 视频创作技能包。简单来说，它能让你用 7 个 AI Agent 组成一个虚拟的视频工作室，接管从深度调研、脚本写作、TTS 配音到 Remotion 动画渲染、多平台 SEO 包装的全部工作。为什么要做这个工具随着 AI 能力的不断提升，用 AI 创作短视频已经变得非常容易。如今我们能在抖音或 B 站上刷到各种 AI 生成的视频。但无论是先进的 Seedance 2.0，还是 Gemini omni，它们都有一些共性问题，比如速度慢，比如难控制。有时候为了生成一段满意的视频，我们需要反复掷骰子，不断挑选、拼接，消耗大量时间，更别说批量生产短视频了。虽然我认为以现在的发展速度，AI 迟早能解决上面的这些问题，但毕竟当下这些痛点还依然存在。所以于是我就在想：能不能通过多 agent 协作的工作流，让 AI 视频生成变得稍微可控一点？至少当我们对最终交付的视频成品不满意时，可以不必从头来过，而是对工作流中的某个节点进行修改，这样能节约不少时间。于是就有了这个项目。它尤其适合制作批量的科普类短视频，从查资料、写逐字稿、录音或配置 TTS、剪辑、做动画、到各个视频平台的标题和简介包装，这一整个流程都能让特性各异的 AI Agent 来合作完成。你只需要提供选题，AI 就能像流水线一样为你批量生产视频。你当然可以自己配音，再加上讲解的 A Roll，这样视频质量会更高。 7 个 Agent，6 个阶段在这个项目里，我把视频制作流程拆解成了 7 个具体角色的协作： Director（导演/编排）：整个工作室的大管家，负责接收你的选题，拆解任务并派发给其他 Agent。 Researcher（研究员）：负责深度调研，输出结构化的研究数据。 Writer（作家）：根据研究数据，撰写视频脚本初稿。 Editor（编辑）：专门负责“去 AI 润色”，定稿最终脚本。 Narrator（播音员）：调用 TTS 工具生成配音，并输出时间轴同步文件。 Renderer（渲染师）：基于 Remotion 将文本、音频转化为动态的视频画面。 Packager（包装师）：生成适合 YouTube、Bilibili 等平台的标题、简介和标签。整个管线完全是自动流转的。你可以选择不同的工作模式：如果你想随时插话，可以拉一个“群聊”看着它们讨论；如果你只想看结果，可以单线联系 Director，让它在后台“委派”工作；如果你需要批量生产，还可以用看板模式管理进度。 ...

上线了一个离职补偿金计算工具

最近上线了一个小工具：SeveranceGO-CN：中国离职补偿金计算工具。项目代码也放在 GitHub：masonblog/SeveranceGO-CN 。它的用途很直接：输入入职时间、离职时间、上一年度收入、劳动合同履行地、合同签署情况、离职原因等信息后，工具会估算经济补偿金、违法解除赔偿金、代通知金，以及未签书面劳动合同可能对应的二倍工资区间。先把免责声明放在前面：这只是辅助估算，不能替代正式法律意见和律师判断。劳动争议里，解除理由、通知程序、证据材料、当地工资口径、仲裁和法院尺度，都会影响最后结果。这个工具更像一次"第一轮体检"：先把大概区间、关键变量和风险点列出来，方便当事人知道接下来该核对什么。为什么要做这个工具做公司业务和劳动争议咨询时，我经常遇到同一个问题：公司要跟我解除劳动合同，我大概能拿多少钱？这个问题看似简单，其实很容易算偏。很多人只记得一个公式：工作几年就是 N，违法解除就是 2N。但真正落到个案里，马上会冒出一堆细节：工作年限怎么折算？半年以上不满一年算不算一年？月工资有没有封顶？当地上年度职工月平均工资是多少？公司属于无过失性解除，还是经济性裁员？有没有提前三十日通知？没签书面劳动合同的期间从哪天起算、到哪天截止？律师当然可以逐项解释，但很多基础问题完全可以先交给一个表单处理。尤其是在咨询前，如果当事人已经知道自己可能涉及 N、N+1、2N，还是二倍工资争议，沟通效率会高很多。于是我就想做一个尽量朴素的工具：不制造焦虑，不承诺结果，只把规则摊开，把计算过程写清楚。法律规则不是一句 prompt 就能解决的东西这个项目最有意思的地方，在于如何把劳动法规则翻译成代码。法律人看《劳动合同法》第四十六条、第四十七条、第八十二条时，脑子里浮现的是构成要件和法律效果：什么情形应当支付经济补偿，补偿年限如何计算，月工资基数如何确定，什么情况下适用三倍封顶，未签书面合同什么时候触发二倍工资。程序员看同一组问题，看到的是输入、分支、边界条件和输出。 Vibe Coding 的价值也在这里：我不用先把自己训练成一个全栈工程师，才能开始做产品。但这并不意味着我可以只对 AI 说一句"帮我做个离职补偿计算器"，然后等它交付成品。越是法律产品，越不能这样做。我的做法是先把规则拆成几层：事实输入层：入职、离职、收入、地点、合同签订时间、解除原因。法律判断层：判断是否可能存在经济补偿、违法解除赔偿、代通知金或二倍工资。数据口径层：匹配地区工资数据、最低工资、封顶基数，并允许用户手动覆盖。结果说明层：不仅给一个数字，还要说明这个数字是怎么来的、哪些地方需要复核。这其实很像写一份法律检索备忘录：先列事实，再列规范，再做归入，最后提示风险。只不过这次的输出物从 Word 文档变成了一套可以运行的 React + TypeScript 页面。最难的是边界感做法律工具，最怕两种倾向。一种是装得太懂。明明只是按公开规则做估算，却把结果包装成"你一定能拿到这么多钱"。这很危险，因为劳动争议高度依赖证据和程序细节，一个解除通知书的措辞、一次谈话录音、一次调岗降薪的背景，都可能改变判断。另一种是缩得太后。什么都说"具体情况具体分析"，最后用户看完还是不知道自己在哪里。我希望这个工具站在中间：该算的先算，该提示的明确提示，该留白的地方不要硬判。比如疑似违法解除，就展示 2N 的估算区间，同时提醒用户核查解除理由、规章制度、送达程序和证据链；涉及第 40 条解除，就把是否提前三十日通知作为影响 N+1 的因素；未签书面合同，则单独估算可能的二倍工资区间，不把它粗暴塞进补偿金里。这也是法律人参与 Vibe Coding 的一个优势：我们对"不确定性"比较敏感。代码喜欢确定答案，法律常常只有风险区间。真正要做得可用，就要让产品承认这种不确定性。数据口径：先可用，再持续修首版内置了 2024 年工资标准参考数据，并覆盖中国大陆各省级行政区下的地级行政区、自治州、地区、盟以及部分省直管县级行政单位。这里面最麻烦的是，各地公开口径并不完全一致，有的城市能找到官方全口径或城镇单位平均工资，有的只能暂用国家统计局分区域数据作为封顶参考；最低工资也会存在不同档位。所以我在页面里保留了"可覆盖"输入框：如果用户掌握当地仲裁、法院或人社部门最新口径，可以手动填入。对法律工具来说，这比假装数据库永远正确要诚实得多。后续我会继续补充和校正数据源，也欢迎熟悉本地劳动争议口径的朋友提 issue 或 PR。给律师的一点感想过去我们总觉得，律师的技术化转型大概就是会用检索库、会写提示词、会让 AI 起草合同。但做完这个工具后，我越来越觉得，真正有价值的地方不止是"让 AI 替我们写文字"，还包括把法律服务里可以结构化的部分产品化。 ...

借助 AI，我做了一个各省假期政策查询网站

起心动念：一个法学生的"不务正业" 作为一名公司律师，我每天打交道最多的就是各种法规条文，以及来咨询各种法律条文的亲戚朋友。其中一个最常被问到的问题，就是各种劳动法规。尤其是各地假期政策，比如婚假怎么请，产假有多长……这些是每个人都会遇到的问题。前段时间，我有个朋友跳槽到一家深圳的公司，问我：“深圳的陪产假到底是几天？网上查的乱七八糟的。“我翻了一圈，发现确实如此。国家层面有一套规定，各省又有各自补充的地方规定，信息散落在各级人社厅的官网、政府公报、地方性法规里，没有一个能一站式对比查看的地方。我当时就想：要是有一个网站，选一个省份，所有假期政策一目了然，中央规定和地方特别规定并列展示，每条规则还附上法律出处，那该多好。然后我脑子里蹦出另一个念头——我为什么不自己做一个呢？放在以前，这个念头冒出来三秒钟就会被我自己摁回去。我不会写前端，不会画地图，不知道怎么部署网站。但最近这一年，情况变了。当法学撞上 Vibe Coding 先聊聊什么是 Vibe Coding。这个词是 Andrej Karpathy 在 2025 年初提出来的，大意是：你不再需要逐行手写代码，而是用自然语言描述你想要什么，AI 帮你写。你要做的不是"编程”，而是"指挥”。你负责想法和品位，AI 负责执行。我刚接触 Vibe Coding 的时候，也经历过一段迷茫期。看别人用 Cursor、用 Claude Code 三下五除二搞出一个项目，自己上去一试，发现根本不是那么回事。AI 确实能写代码，但写出来的东西经常有这样那样的问题：组件渲染不出来、类型报错、样式错乱、路由不对…… 后来我慢慢悟出来一个道理：Vibe Coding 不是"不用动脑子"，而是"换一种方式动脑子"。你不能真的完全放手，你得学会审阅代码、提出精准的修改指令、在 AI 卡壳的时候指出方向。某种意义上，这和 review 一篇法学论文没什么区别——你不是从头到尾自己写每一个字，但你必须判断哪里有问题、该怎么改。而我的法律背景，在这个项目里扮演了一个意想不到的角色。法律思维如何重塑我的开发流程法学的核心训练是什么？如果只让我说一点，那就是体系化的分类与归入。面对一个案件，你要做的第一件事不是拍脑袋下结论，而是把事实拆解成若干个法律要件，逐一检视，最后得出结论。这套思维方式，在我做这个假期政策查询网站的时候，天然地映射到了数据结构的搭建上。假期政策说白了，就是一个多层级的规则体系：第一层，国家法定基准。比如产假 98 天、婚假 3 天，这是写在《女职工劳动保护特别规定》和《人口与计划生育法》里的，全国通用。第二层，各省地方补充规定。比如上海在 98 天基础上再加 30 天产假，广东的陪产假是 15 天，少数民族自治地方还有特殊政策。第三层，兜底规则。如果地方没有特别规定，就自动沿用中央标准。这个三层结构，我用法学里"一般法与特别法"的关系来理解：特别法优先于一般法，特别法没有规定的，适用一般法。这恰恰就是代码里 mergePolicy() 函数的核心逻辑——先加载中央基准数据，再用各省的覆盖字段去 merge，本地有的覆盖中央，本地没有的 fallback 到中央。所以当 AI 问我要怎么设计数据结构的时候，我几乎没有犹豫就画出了这个 YAML schema：婚姻假: 天数: 3 适用条件: 依法办理结婚登记的夫妻工资待遇: 正常发放法律依据: - 名称: 国家劳动总局、财政部关于国营企业职工请婚丧假和路程假问题的通知条款: 第一条然后在各省的文件里，只写和中央不同的部分。比如江苏： ...

Claude Code 源代码泄露：一个 .npmignore 引发的连锁风暴

2026 年 3 月 31 日，AI 圈迎来了一场意想不到的"愚人节前夕大礼"：Anthropic 旗下明星产品 Claude Code 的全部源代码，因一个打包失误意外流向了互联网。这不是黑客攻击，不是内鬼泄密，而是有人忘记在 .npmignore 里加了一行 *.map。就这样，51 万行 TypeScript 代码、44 个隐藏功能开关、以及一个叫做 KAIROS 的神秘"后台自主代理"，在几小时内暴露在所有人面前。事件经过：一个 .map 文件引发的雪崩泄露是如何发生的？ 2026 年 3 月 31 日，Anthropic 在 npm 上发布了 @anthropic-ai/claude-code 的 2.1.88 版本。这次更新本是例行维护，但却附带了一个巨大的"彩蛋"——一个 59.8 MB 的 JavaScript Source Map 文件（.map 后缀）。 Source Map 是开发者用于调试压缩/混淆代码的工具，它能将编译后的代码映射回原始的 TypeScript 源码。正是这个本应只存在于内部的调试文件，被意外打入了公开发布的 npm 包里。更关键的是，这个 .map 文件还指向了一个 Anthropic 自家云存储上的 ZIP 压缩包，里面存放着完整的源代码仓库。所有人只需要顺着这条线索，就能下载到全部代码。根本原因：有人忘记在 .npmignore 文件中添加 *.map 规则，导致 Source Map 文件随包一起发布。传播有多快？代码在公开后数小时内便被开发者社区察觉，随即被备份到 GitHub 上。根据 Layer5 的统计，相关仓库的 Fork 数量迅速突破 41,500 次，一度成为 GitHub 历史上增长最快的仓库。 ...

如何在 Windows 上使用 ClawdBot ：用 Gemini 和 Telegram 打造你的私人 AI 助理

你听说过 ClawdBot 吗？这是一个目前非常热门的开源个人 AI 助手。与那些只会“坐等指令”的传统聊天机器人不同，ClawdBot 具有主动性——它可以主动给你发消息、管理任务，而且是运行在你自己的本地设备上。虽然很多教程都推荐在 Mac Mini 或 Linux 服务器上运行它，但其实在 Windows 上运行它也完全没问题。在这篇文章中，我将手把手教你在 Windows 上安装 ClawdBot，将其配置为使用 Google 的 Gemini API（目前最好的 AI 模型，并且赠送有免费额度），并连接到 Telegram，让你随时随地都能与你的 AI 助手聊天。 🛠️ 准备工作在开始之前，请确保你准备好了以下几样东西：一台运行 Windows 11 的电脑。一个 Google Gemini API Key（密钥）：你可以在 Google AI Studio 免费获取。一个 Telegram 账号：用于创建你的机器人。第一步：安装 WSL2 (Windows Subsystem for Linux) 关键点： ClawdBot 无法直接在 Windows 的 PowerShell 或 CMD 中原生运行。它需要一个 Linux 环境。幸运的是，Windows 自带了一个完美的工具——WSL2。点击 Windows 开始菜单，找到 PowerShell，右键选择 “以管理员身份运行”。 ...