我很焦虑,我不懂老板开会在说什么
最近半年,有三个词反复出现在我参与的会议中被人提起:Context Engineering(这个之前的理解就是多轮对话提炼重点,顺便接几个MCP)Harness Engineering (啥玩意,我以为是爱马仕包包)
我要搞懂这三者的关系
打开任何一篇讲 AI 的文章,你会看到一堆名词在打架:"Context 也只是过渡,未来是 Harness"每个人都讲得很有道理,但放在一起就让人懵——这三个东西到底什么关系?
让我开窍的一个比喻
直到我看到一个"实习生"的比喻,才把这事真的想明白。把 AI(不管是 Claude、GPT 还是 Gemini)当成一个新来的实习生。他能力不算天才,也不算笨——重点是,他的能力是固定的。你作为他的主管,从三个维度决定他到底能不能干出活。维度一:你怎么交代任务 -Prompt
你扔给他一句"帮我做个竞品分析"——大概率他交回来一坨垃圾。"对比 A、B、C 三家产品的定价策略,输出一个三栏表格,每栏不超过 200 字,最后一句话总结推荐哪家。"
我后来发现它有上限——单轮、封闭的小事好说,复杂工作根本扛不住。维度二:你给他配齐资料-Context
实习生再聪明,他第一天到公司,他不知道客户是谁、过往报告长什么样、公司模板放在哪。你不把这些摆桌上,他干不了"竞品分析"这种需要背景知识的活。我自己实践下来发现——给资料 ≠ 能交付。多步骤的任务,他还是会走丢、跑偏、"假装完成"。维度三:你为他建一整套工作机制-Harness
第一次想通这层的时候我有点震撼——它跟前两个根本不是一个维度的东西。前两招是让"一个人做得更好";这一招是让"一个会犯错的系统也能稳定运行"。
那它们的关系到底是?
但新一代不会抹掉旧一代——做 Harness 的人必须懂 Context,懂 Context 的人必须懂 Prompt。模型是 CPU,Context 是 RAM,Harness 是操作系统。
光有 CPU 强没用。Win 95 装 i9 也跑不出 macOS 的体验。
顺便讲讲我自己的几个 Claude 项目
- 每天 20:00:抓我关注博主的 B 站、YouTube 频道,整理成日报
- 每天 22:00:拉 10 个 AI 博客的 RSS,翻译总结成中文 AI 科技日报
- 每周一次:跑一遍海外 AI 助手的最新动态,合成竞品周报
- 每天 23:30:把昨天的笔记自动归档到当月文件夹
另外我现在所有的需求拆解和原型设计都是靠Claude+Obsidian完成的;这些事我本来想让OpenClaw小龙虾帮我干,但折腾半个月后我发现小龙虾是个半成品,根本配不上他的热度。用claude cli搭起来之后,我下班它开始干活,第二天早上打开笔记本,所有东西已经在那等我了。Claude Opus 4.7模型很强是一个原因,但更重要的是他的工作流程:- AGENTS.md 文件(告诉 Claude 每个项目的规则)
这些东西,没有一个是模型本身——它们都是 Harness 层的。我搭这些东西的过程,让我切身体会到一件事——真正卡住普通人用好 AI 的瓶颈,早就不在模型聪不聪明了。
顺便聊聊我对 Gemini 的不解
我是Gemini pro年度会员,但我现在很少用了。Gemini 的模型能力很不错,审美在线,多模态甚至更强。没有像 Claude Code 那样的 CLI 工具生态它现在的核心卖点还在"上下文窗口更长""和 Workspace 集成更深""多模态更强"——这些都是模型 + Context 层的事。我不是说 Google 做错了。我是想不通——为什么它好像还在用上一代的玩法,去打下一代的战场?可能是策略选择,可能是节奏问题,也可能是我作为外部用户看不到的内部考量。
我现在的阶段性理解
写到这里,我自己整理出三层认知(不一定对,欢迎讨论):Prompt 决定 AI 听不听得懂你说什么。Context 决定 AI 有没有拿到完成任务所需的信息。Harness 决定 AI 即使会犯错,整个系统能不能稳定跑下来。
非确定系统的失败永远不会消失,只能被框住。
下次 AI 翻车了,先想想是不是harness 没搭好,再去骂模型。