开启Harness Engineering探索之旅
出处:
mp.weixin.qq.com
过去两年,AI Coding 从"能写出能跑的代码"走到"能放手让它写一整段功能"。但把这个能力放进真实业务、放进多人协作、放进存量系统里跑时我们发现一件怪事——AI 写得越快,整体节奏并没有同步加快。盘点下来,单看"AI 写出来的代码占比"这个数字一路走高,可真正落到版本节奏上,提效却远没有这个数字好看。出码率和提效之间,裂开了一道缝。从 OpenAI Codex 团队那篇 Harness 工程博客里反复强调的一个观察——"早期进展比预期慢,并不是因为 Codex 不具备相应的能力,而是因为环境的规范不够明确"——开始,整个行业都在补同一件事:给模型搭一套能稳定干活的"工作环境"。这一层最近被业界命名为 Harness Engineering——它不是教模型怎么回答,而是设计模型怎么工作。 在这里,也分享下我们的探索之旅,是踩过的坑、做过的取舍、和到现在还没解决的问题。