本文将分享阿里集团在 AI 代码评审方向“历时一年半”、“数万亿 Token 真实场景打磨”的探索现状,以及我们联合南京大学研发效能实验室开源的、汇聚 80 多位资深工程师进行多轮交叉标注的业界首个多语言、具备存储库上下文感知的 CodeReview Benchmark,旨在为行业提供更精准的质量评估标准。
以 OpenClaw 为案例,从行业威胁态势与运行时防护的固有局限出发,系统拆解 AI Agent 可观测体系的设计方法论:通过 Session 审计日志、应用日志与 OpenTelemetry 遥测三条数据管道,构建行为审计、威胁检测、成本管控与运维观测的完整闭环。
本文介绍了利用 AI平台,通过自然语言描述业务规则 + 预置 AI Agent + 参数化调用的方式,替代传统复杂代码(150+行)来解决电商促销中“多 SKU 凑单破价”资损风险巡检问题的实践方案;核心价值在于将高理解成本、难维护的硬编码逻辑,转化为可读性强、修改便捷、开箱即用的 AI 驱动分析流程,并在开发效率、维护成本、响应速度和业务价值上实现显著提升。
事情是这样的,之前对 AI 编程一直是观望态度,但是部门最近在做 AI 辅助编程 POC,有幸成为 POC 用户,用上了自己舍不得买的高级编程模型 (感谢公司)。尽管我自认为是一个在代码上很挑剔的人,但是试了下感觉居然还可以 (Go、React)!只能说还得是谷歌,调整重心略微发力,Gemini 3 表现确实很不错。既然尝到甜头了,觉得自己是时候好好地琢磨琢磨,研究研究,沉淀一套自己的工作流、方法论,解放自己的生产力,顺应潮流努力成为 AI 时代的受益者,而不是被淘汰的人! 新的开发范式需要搭建新的开发环境和匹配自己开发习惯的工作流,这就像刚学编程那会,需要挑一个自己喜欢的 IDE、熟悉 IDE 快捷键和优化 IDE 设置一样。过程中间肯定有阵痛,Java 开发者们回忆一下多年之前从 Eclipse 转 IDEA 那会的阵痛吧,但是磨刀不误砍柴工,阵痛之后一定是生产力提升。借本文分享下我摸索后的方案,供大家参考。
这半年来,各种拥有几万个Skills的网站层出不穷,面对各种酷炫的Skills,我有些茫然!Skills虽强,但 “为何要用”是一个值得思考的问题,有时我们有了屠龙刀,但龙呢?带着这份困惑,我想分享对Skills的一些思考。
为突破传统 Web 框架的性能瓶颈,大众点评增长团队引入 Qwik.js 重构 M 站核心页面架构,解决了重构前页面加载慢、维护成本高的难题。借助“可恢复性”能力,我们甩掉了传统水合的性能损耗,搭配全链路优化与工程化适配,让各个页面的性能指标都得到了明显提升。本文将拆解本次重构的技术选型、原理与落地细节,沉淀前沿框架在站外场景的落地经验。
回望 B 站富文本编辑器的演进史,我们经历了一个从“无”到“有”,再从“有”到“优”的过程。在 UEditor 时代,我们解决了基本的文本编辑需求;在 Quill 时代,我们引入了 Delta 数据模型。然而,在 Quill 时期,面对视频卡等复杂卡片,受限于 Quill 对 BlockNode 缺乏完善的支持,被迫采用“ Canvas 绘图伪造卡片” 的障眼法。今天,拥抱 ProseMirror 生态,这套“ 截图大法” 终于画上句号,取而代之的是支持真实交互的卡片渲染系统。这场从“伪造”到“真实”的革命,不仅是一次技术栈的迁移,更是一次对技术债的降维打击。今天就带大家深入代码底层,看看我们是如何填平这个深坑的。
这篇文章由三个部分构成,希望可以从看自己、看行业、看世界三个视角,讲一讲我的思考,以及在这巨变的时代,不变的本质是什么。第一部分,我会从一名 AI 产品 Agent 工程师的视角,聊聊我亲身经历的一些变化,以及在这些变化里我越来越确信的一件事:有些东西一直在变,但也有些东西几乎没怎么变过。我觉得这一点,对任何行业的人都可能有点用。第二部分,是一些关于行业与 AI 结合的思考。我这些年换过几个行业,接触过教育、营销、金融。因为最近九年都在阿里巴巴,所以会重点聊聊营销、人群运营和金融领域,我看到AI改变了它们什么。教育那段以后有机会再慢慢聊。第三部分,是我对最近一些很火的 AI 产品(ClaudeCode、OpenClaw 等)的看法:这类产品是由什么技术构建的、最核心的是什么,以及我认为不变的部分是什么。