AI Native 不仅指产品形态。在一些更窄的场景里,比如编程领域,它也可以特指 AI Native 研发。但这里的AI Native 研发,不是让 Agent 写更多代码,也不是让 AI 零散参与研发流程,而是在清晰边界、可观测 checkpoint 和可验证闭环下,让代码生成、测试、修复、验证等实施动作尽可能由 AI 连续完成。人的角色不消失,而是上移到设定目标与边界、审阅 checkpoint、判断转向和最终验收。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)
2025年底,一款叫 OpenClaw 的开源 AI Agent 工具横空出世。因为 Logo 像只龙虾,因此国内都叫他小龙虾。之前所有的 AI 产品,本质上都是问答机器——你问,它答,然后你自己去执行。OpenClaw 打破了这个边界,它可以直接调用工具、操作浏览器、读写文件、发送消息、定时自动运行……它不只是给你建议,而是帮你把事情做完。
本文介绍了淘天音视频团队联合外部合作伙伴提出的 LocalDPO 方法,成功入选计算机视觉顶会 CVPR 2026(录用率约25%),针对视频生成模型后训练中局部细节优化难、传统DPO依赖高成本多次采样与人工标注的痛点,创新性地以高质量真实视频为正样本,通过局部时空退化自动构造负样本,并设计区域感知 DPO 损失实现细粒度偏好对齐。该方法无需外部打分模型或人工标注,在 CogVideoX、Wan2.1等主流视频模型上显著提升视觉质量、时序一致性及人类偏好(如纹理清晰度、伪影抑制、运动稳定性),实验表明其在多项自动评测与20人主观评测中均大幅优于 SFT、Vanilla DPO 等基线,为视频生成模型的高效后训练提供了新范式,相关代码与模型已开源。
应用宝活动平台系统支撑应用宝内包括 app、pc、手助等产品的所有日常/节假日活动,在今年上半年,我们针对整套系统进行了一次完整的重构。正值这个时间点,Harness Engineering 的概念被提出,我们团队也在重构的过程中,针对新的活动平台系统引入 Harness Engineering 的工程实践,初步搭建了一套 AI 端到端的开发流程。 这篇文章主要记录了团队在践行 Harness 工程化过程中遇到的一些问题以及实践经验,抛砖引玉,欢迎其他团队同学一起探讨。
2023 年是大语言模型落地应用的早期阶段,也是“年薪百万的提示词工程师”刷屏的一年。工业界曾一度将核心精力投射于提示词工程,导致市面上充斥着“万能 Prompt 模板”和“Prompt 圣经”。与此同时,方法论侧也在经历系统化的演进,从早期的少样本提示发展至思维链、思维树等高级策略[1],与依赖用户直觉的“盲提示(Blind Prompting)”划清了界限[2]。这是上半场的故事:人们在卷“怎么跟 AI 说话”。然而依赖单次交互的“提示-响应”模式所带来的瓶颈也很明显。稍微深度用过 AI 的人都会发现,无论 Prompt 写得多巧,自己仍然充当“人肉缝合怪”的角色——把代码贴进去、复制结果、跑出错、把报错粘回来、改 Prompt、再来一遍。当应用于大型软件工程或复杂业务场景中时,这种瓶颈会被进一步放大。上述单轮交互模式无法支撑多步逻辑推理,亦无法自主维护工具状态或进行跨会话的记忆管理[3],使得人类研究者在实质上成为了维持系统运转的中转站。