包裹模型的 操作系统
模型本身只是 CPU。让"无状态" LLM 变成会用工具、有记忆、能自我纠错的 Agent, 靠的不是模型升级,而是它外围那一整套被称为 Harness 的基础设施。
"如果你不是模型本身,那你就是 Harness。" —— Vivek Trivedy, LangChain
原生 LLM 是 没有外设的 CPU
Beren Millidge 给过一个精准的类比:原生大语言模型像一颗没有内存、没有硬盘、也没有 IO 设备的 CPU。 上下文窗口是它的内存(快但小),外部数据库是硬盘(大但慢),工具集成是设备驱动。 而 Harness,就是把这些零件粘起来的操作系统。
冯·诺依曼架构的重新发明
围绕模型的 三个同心圆
从内到外,工程化的范围在不断扩大。Harness 工程包住了前两者。
-
01Prompt Engineering精心设计模型每次接收到的指令。最内圈,最早被工程化。
-
02Context Engineering管理模型在什么时间点能看到什么内容。压缩、检索、掩码、子智能体浓缩,都是这一层的工作。
-
03Harness Engineering前两者 + 工具编排 + 状态持久化 + 错误恢复 + 验证循环 + 安全执行 + 生命周期管理。完整的应用架构。
生产级 Harness 的 12 个组件
点击卡片查看细节。BRAIN OS 标记的组件,是你已经在 Brain OS 编排层里做出对应实现的。先看它们,再看缺口。
一次循环里的 7 个动作
Anthropic 把他们的运行时描述为一个"笨循环"——所有智慧都存在模型里,Harness 只负责管理回合切换。
但每一步要做的事并不简单。下面这张图是你 Brain OS 里 claude_step 真正应该长成的样子。
同样的概念,五种姿态
所有这些框架都在解决同一个问题,但在"哪部分留给模型、哪部分写死在代码里"上做出了截然不同的选择。理解差异,你就知道自己 Brain OS 的编排层在哪个流派。
Claude Agent SDK
query() 函数暴露 Harness。运行时被称为"笨循环"——所有智慧都在模型里,Harness 只负责传话和执行。明确把"权限"和"推理"在架构层分离。Agents SDK
LangGraph
CrewAI
AutoGen
每个 Harness 都要回答的 7 个问题
两个用相同模型的智能体,性能可能天差地别。差距来自下面这 7 个决策。每一个都附了一条 Brain OS 视角的反思——不是答案,是问题。
你 已经做了什么,还 缺什么
把这篇文章的 12 个组件投影到你的 Brain OS 上。左边是你的编排层已经覆盖的部分,右边是按文章标准看还薄弱、值得优先补的位置。
已经覆盖
-
编排循环
YAML pipeline 串起
claude_step和local_step,本质就是文章描述的"笨循环"。 - 工具层 local_step 是 Python 工具,claude_step 通过 SKILL.md 注入能力。工具协议清晰。
- 状态管理 JSONL state store 做 run 持久化,可 resume——和 LangGraph 的 checkpointing 思想一致。
-
护栏(人在回路)
pause_for_reviewgate 在标题选择、合规风险、最终发布——真实的决策点。这是设计良好的人类介入。 - 验证循环(部分) DingTalk 项目里的 verify.sh + CLAUDE.md + Playwright E2E + AI screenshot review,恰好覆盖了文章推荐的三种方法。
值得补的缺口
- 上下文管理 目前 SKILL.md 全量加载。当 pipeline 跑长链条(拆解 → 改写 → 题图 → 合规 → 发布),还没有 compaction、observation masking 或 just-in-time retrieval。是 Brain OS 长跑后失忆的高风险点。
- 记忆系统的三层结构 ingest / archaeologist / memory-archiver 还是分散的。Claude Code 的"轻索引 + 主题文件 + 原始记录"三层架构,是个值得复刻的标杆。
- 错误处理分级 目前的错误处理偏粗。LangGraph 的四分类(临时/模型可恢复/用户可修复/上报)可以直接迁移成 pipeline 的错误恢复策略表。
- 子智能体编排 content-pipeline 链是顺序的,没有 fork / teammate / worktree 模式。当你需要"同时跑 3 个题图候选 + 选最优"这种分支任务时,会成为瓶颈。
- 跨环境桥 Claude.ai 的 custom skills 和本地 Python CLI 之间还没有桥。这一条不是文章的标准组件,但是你 Brain OS 进入下一阶段的卡点。
但它永远不会消失。