从热点选题 → 深度调研 → 写稿 → 三轨评审 → 排版 → 封面 → 推草稿,
一共 19 步全自动,产出直接落到微信公众号草稿箱。
不是 prompt 链,是建在 Claude Code 原生 harness 上的工业流水线。
MIT 开源 · Python + Claude Code Agent SDK · git clone 后填凭证即可跑你自己的公众号
Python + Claude Code skill 编排。对标数字生命卡兹克,一个人运营 AI 赛道公众号「研究 Agent 的云」。 所有发出去的文章,都是用这套 pipeline 跑出来的活物,不是设计草稿。
物理 gate.py 拦截:任一 step 没真跑过都通不过。8 项 fake-pass 防伪字段,防主线程拍脑袋写占位。
数字分 + 灵魂判断 + 挂名意愿,三个评委互不知晓彼此 verdict。全自动 critic-revise loop,3 轮后自动出口不等人。
force_ship 学习回路 + flywheel_report.py,把每一次产出沉淀成「改机制而不是改这一篇」的信号。
LLM 只负责「写」这一个动作,真正决定质量的是外面这层 harness: 写完 → 三轨评 → 不过就改 → 物理 gate 拦门 → 飞轮把信号喂回机制。一篇文章在循环里反复打磨,直到所有闸门同时放行。
同一个 Claude,裸用是「能写但不稳」,套上 harness 就成了「每篇都过得了自己这关」的产线。差距全在循环和闸门里。
gate.py 作为 PreToolUse hook 在推草稿前拦一刀,缺任一 pass_flag 直接 sys.exit(2) 阻断。*_pass 又 *_real_run + *_source,正则校验,杜绝「假装跑过」。flywheel_report.py 聚合成「改 writer SOP 不改这一篇」的机制提示,系统会自己变好。数据层喂料 → 决策层选题写稿评审 → 渲染层排版配图 → 发布层推草稿 → 反馈层把结果回灌决策层,形成闭环。
⤴ 反馈层 E 把每次产出的信号回灌决策层 B —— 这就是 harness 循环的闭环
以 WRITE_AGENT.md(系统级宪法)为权威。每一步都有对应的脚本或 skill,跑过留痕,没跑过过不了 gate。
三个评委从不同维度独立投票,互不知晓彼此结论;最后由物理 gate 在推草稿前做不可绕过的拦截。
0–100 分,≥ 60 PASS。5 维加权 + style_match 25% 混合。
这段话有没有 emotion?选题敢不敢从 0 到 1?binary 裁决。
独立第三方评委(Round 24 fork),founder verdict 硬否决优先。
*_pass 又要 *_real_run + *_source,正则校验来源image_paths 非空 + 每文件 ≥ 5KBsys.exit(2) 阻断 Claude 调用建在 Agent SDK + skill 体系上,orchestrator-worker 模式,主线程编排子 agent。
PreToolUse hook 不可绕过,把「质量」从约定变成代码强制执行的不变量。
aihot / 公众号 / RSSHub / arxiv 多源聚合,国内外 1:1,DB 优先读取。
MIT 开源,clone 后填 .env + preflight 全绿即可跑你自己的公众号。
整套系统 MIT 开源在 GitHub,clone 即用跑你自己的公众号; 想定制、想一起做内容、或者单纯想聊聊这套 harness 怎么搭的——加我微信。
微信扫码加好友,备注「来自网站」会优先通过 —— 聊技术 / 聊运营 / 定制开发都行。