AI Coding 已改变研发方式,但单点代码生成只占研发工时 10-32%,整体提效有限。本文从我们团队在民生彩票、政务等项目的真实交付复盘出发,提出 Harness 全链路研发智能体:把大模型放进一套可控的研发流程,将需求分析、接口设计、代码生成、自动 CR、单测、冒烟验证、环境部署、问题排查串成带反馈控制的闭环,让 AI 从"会写代码"升级为"能完成可验证交付"。本文系统阐述其需求可执行性检查、状态机与质量门禁设计、失败回流机制、复杂度感知编排、RD/QA 协同模式,并以行业研究(METR RCT、Google DORA、SWE-bench 等)做交叉印证。
本文以“大模型不是马,而是大脑”为核心视角,重新定义 AI 系统结构,指出当前问题不在模型能力,而在 Agent 作为“身体”的不成熟,分析感知、行动、反馈与调度等工程缺陷,并将 Harness 类系统比作 ICU 的生命维持机制,强调当下混乱源于最佳实践尚未收敛,认为当前阶段本质是“不会用工具”的早期,人类正在通过实践逐步定义 AI 的正确使用方式。
本文基于真实工程实践,结合 Harness Engineering 领域的学术论文,分享 AI 辅助编程的架构思考、工程落地与 Token 成本优化。
在 AI 驱动的数据应用场景中,企业越来越需要一套同时支撑实时消费、历史沉淀与多引擎复用的数据底座。Kafka、Iceberg 开放表格式与对象存储的组合,正成为流数据入湖的重要方向。但传统依赖 Flink、Spark 等外部 ETL 作业的方式,也带来了链路长、系统边界多、运维复杂等问题。本文围绕“零 ETL”这一趋势,讨论流数据入湖为什么需要做架构减法,并结合 Kafka × Table Bucket 的实践,分析一种将通用入湖能力前移到消息与表存储链路中的方案,如何在降低复杂度的同时,兼顾实时性、一致性、Schema 演进、CDC 语义与开放生态兼容。
用 AI 做产品,最大的坑可能不是"做不出来",而是"什么都想做"。本文记录了百度前端研发工程师与 AI 组队开发 Design.md Token Exporter 的全过程——ChatGPT 陪他脑暴、Codex 当主力写代码、Gemini 做体验顾问,但 AI 的热情差点让产品变得臃肿不堪。当技术门槛被击碎后,什么该做、什么不该做,成了每个产品人必须自己回答的问题。这篇文章,讲的就是这个"取舍"的故事。
本文深入分析AI编程(AICoding)效率瓶颈,指出核心问题在于大模型的注意力机制限制、上下文膨胀与注意力坍塌,以及人机协作模式不匹配;提出通过外置 “DeepResearch” 型 Agent 分离“上下文准备”与“编码执行”,以多模态输入、结构化任务、持久化分析和增量更新提升真实提效。