AI学习笔记|Harness工程AI编程范式
Harness工程核心是「人类不直接写代码,而是搭建约束、反馈、上下文环境,引导AI智能体自主完成开发」,实现“人类掌舵、Agent执行”。
一、Harness工程的诞生背景 🚀
🔸 瓶颈转移:AI编码速度远超人类审查速度,质量测试(QA)和代码审查成为新瓶颈,倒逼工程师转向“让AI自主管控”。
🔸 标杆实验:OpenAI Codex团队5个月构建百万行代码产品,零人工编写,仅靠设计Harness实现Agent自主开发。
🔸 壁垒核心:底层AI模型逐渐商品化,围绕模型搭建的Harness系统,成为企业核心竞争力(如LangChain优化Harness,大幅提升测试成绩)。
🔸 角色演变:工程师从“执行者”转变为“系统设计者”,类似瓦特离心调速器、K8s声明式调度的逻辑,聚焦目标与规则设定。
二、Harness工程三大核心支柱 🏗️
本质是通过系统设计,实现对AI智能体的「约束、告知、验证、纠正」,三大支柱缺一不可:
1. 上下文工程(Context Engineering)📑
核心:将人类隐性知识转化为机器可读取的信息,让Agent“找得到、用得上”。
静态上下文:架构规范、API契约等写入代码仓库,用Linter工具验证。
动态上下文:启动时映射目录结构,接入日志、指标,帮助Agent快速适配环境。
关键逻辑:给Agent“地图”而非“说明书”,避免占用过多上下文窗口,引导其自主查找细节。
2. 架构约束与规则化(Architectural Constraints)⚙️
核心:将人类工程师的“代码品味”,转化为可强制执行的规则,避免AI无序开发。
限制即高效:设定严格架构边界(如表现层仅调用服务层),减少Agent无效探索,加速收敛到正确方案。
品味落地:将命名规则、文件大小限制等,编码为Lint规则或结构化测试,违规自动拦截。
3. 熵管理与“垃圾回收”(Entropy Management)🧹
核心:应对AI代码库的“熵增”(文档与代码脱节、死代码堆积),防止技术债务。
清理Agent:定期运行自动化清理工具,扫描问题代码。
黄金法则落地:将工程师经验编码为规则,允许Agent自动发起重构PR,实现代码库“垃圾回收”。
三、关键落地实践 ✅
🔹 构建-验证闭环:强制Agent写代码+编测试用例,自我修复直至通过测试。
🔹 赋予Agent“五官四肢”:实现UI操作,接入日志、指标实现问题自主排查。
🔹 防死循环机制:通过中间件检测无效重复修改,强制Agent调整策略。
🔹 推理预算分配:采用“高-中-高”三明治模式,平衡推理质量与时间成本。