Harness-Engineering:让AI代理高效运作的系统架构
决定自主人工智能代理能否成功的,并非人工智能模型本身,而是系统的架构——包括上下文、规则和反馈循环。
“框架工程”为人工智能代理定义了规则、上下文和反馈机制,因此已成为现代人工智能系统的关键技术。
“Harness”(束缚系统)一词最初源自马术运动。它指的是套在马身上的马具,用于正确地驾驭马匹。因此,在工程领域中,“Harness”是指为人工智能代理提供的基础设施,它通过限制、准则和反馈循环为模型提供框架。模型本身则类似于一匹马:性能强大,但需要引导。在这个比喻中,工程师就是那位指明方向但并不亲自奔跑的骑手。Harness工程是指设计和实现能够设定架构边界并定义依赖规则的系统。AI代理会通过该系统获知其任务内容。Harness 提供必要的文档和上下文,它会验证任务是否正确执行,并通过反馈循环对代理进行纠正。目前,AI 模型和代理正充斥着市场和社区。关键的区别在于其周围的系统架构,因为即使微小的架构调整,也能对结果产生巨大影响,而完全无需更改模型本身。
Index
关键在于框架
OpenAI 于 2025 年 8 月通过一项自我实验探讨了这一主题,并于今年年初发布了一篇值得一读的 文章。
一个团队花了五个月时间开发并部署了一个软件的内部测试版,而在此过程中,他们自己没有编写过一行代码。全部代码、应用逻辑、测试、文档和监控均由内部工具自动生成。开发人员估计,这仅耗费了他们手动编写软件所需时间的十分之一。最终,通过这种方式生成了超过一百万行代码。OpenAI团队的核心问题已不再是:“如何在短时间内编写出可运行的代码?”,而是:“需要什么样的环境才能借助 AI 代理实现这一目标?”因此,任务变成了设计一个合适的环境,明确意图,并建立清晰定义的反馈循环。这个项目最初始于一个空的 Git 仓库,如今已包含百万行代码,这些代码分布在基础设施、应用逻辑、文档、开发工具以及工具本身之中。
这个例子有力地说明了为什么 Harness Engineering 如此强大。这也体现出在处理 AI 系统方面发生了一场根本性的转变。纯粹的提示工程旨在优化与模型的单次交互,而 Harness Engineering 则致力于协调整个系统。
核心挑战不再仅仅在于构思尽可能优质、精准的提示词,而是要构建一个环境,让 AI 代理能够以可控、可复现且高效的方式运行。因此,上下文提供、反馈循环、规则和可观测性比模型本身更为重要。
为了使 Harness 工程得以广泛应用,OpenAI 还提供了一个框架,该框架分为三个类别:上下文工程、架构约束和熵管理。
实际上,一个 Harness 本身由多个技术组件构成,这些组件共同定义了 AI 代理的工作环境。其中包括:
- 用于提供上下文和文档的系统
- 检索、存储和知识访问工具
- 用于日志、指标和跟踪的可观测性解决方案
- 评估和测试管道
- 策略和权限系统
- 任务分配和代理编排机制
- 反馈与审查系统
只有这些组件协同作用,才能在生产软件系统中受控地部署 AI 代理,并充分发挥其潜力。这一基本架构使得前述框架得以应用。
上下文工程
上下文工程是确保 AI 代理能够在正确的时间获得正确信息的关键手段。在此,我们区分“静态上下文”和“动态上下文”。静态上下文可以是存储库本地文档,例如 API 契约或风格指南。而动态上下文则包括代理启动时的目录结构映射,以及日志、指标和跟踪等可观测性数据。
架构限制
通过此处设定的框架条件——例如自定义规则、负责监控其他代理的代理、代码固定化前的自动化检查或结构测试——实际上强制规定了代码应有的形态。这些限制有助于代理更有针对性地得出解决方案,并减少令牌消耗。
熵管理
随着时间推移,AI 生成的代码库中不可避免地会产生数据垃圾。为应对这一情况,代理在此也发挥作用:有的负责检查文档的一致性,有的强制使用预设模式,还有的则扫描在先前检查中未被标记且不符合规范的代码。这些代理定期运行,负责处理内部的“大扫除”。
随着自主AI代理的日益普及,软件开发的角色也发生了根本性的变化。工作重点正逐步从手动编写单个实现转向智能系统的协调。开发人员越来越少亲自定义每个具体的解决方案,而是设计AI代理可以工作的框架条件。
未来,工程师的主要任务将更多地在于制定目标、规则和约束条件。架构原则、安全准则、质量要求和反馈机制将成为开发工作的核心组成部分。实际的代码编写正日益演变为受控系统内一个自动化的执行过程。
因此,框架工程(Harness Engineering)将成为现代软件开发的核心能力。决定系统质量的并非单个模型,而是提供上下文、协调代理并持续评估其结果的能力。
人工智能模型性能越强、技术趋同程度越高,围绕这些模型的系统架构就越重要。因此,Harness 正从辅助工具演变为 AI 代理的实际生产系统。当 AI 模型日益成为可互换的商品时,Harness 最终将决定自主系统的质量、安全性和可扩展性,而作为下一阶段的演进,Harness 工程将能做出宝贵的贡献。

Comments are closed.