前段时间,《人民想念DeepSeek》刷屏,文章提到一点——DeepSeek推动了全球大模型的降本,让用户和行业得以享受更便宜的Token。关键的问题是,“小龙虾”这类智能体应用的疯狂“烧Token”,再次推高用户的使用成本,这种情况下,推动全行业降本增效的重任又落到了DeepSeek的肩上。算算时间,DeepSeek V3、R1发布已一年有余,外界原本预期DeepSeek V4今年春节会来炸场,但最终希望落空。不过,从近期宕机、专家模式上线等一系列动态来看,感觉DeepSeek V4有可能离我们越来越近了。所以,这可能也是最后一次“催更”DeepSeek。在这封催更信里面,我想和那些想念DeepSeek的朋友,聊聊中国AI的叙事、技术进化的浪潮、生态竞争、Token经济学这些话题。
本文是悟空Agent泛化能力系列的先导篇。我们不展开技术细节,只回答一个核心问题:为什么悟空Agent在漏洞挖掘中需要泛化能力。后续系列将深入拆解泛化体系的每个环节——感知、建模、自迭代、规模化验证。如果你对AI代码安全感兴趣,这是一个值得从头跟下去的故事。
还记得手动部署的古早编程时代吗? 代码写完,打个 tar 包,开 FTP 传到服务器上,SSH 进去解压,改配置文件,重启服务,刷一下页面祈祷别 500。有时候还得半夜部署,因为白天不敢动生产环境。运气不好配置写错了,回滚靠的是上次手动备份的那个文件夹,如果你还记得放在哪儿的话。
近期,某顶级 AI Agent 研究团队的一个工业级 Harness 项目源码在开发者社区中引起广泛关注。这个项目是一个基于 TypeScript 的 CLI 形态 AI Coding Agent,其工程规模和架构成熟度令社区印象深刻
我原本以为最难的是写好 Agent 的 prompt,但其实 Agent 只改动了一两个版本,更多的精力都在如何让这些 Agent 稳定运行。这篇文章不讲代码,因为AI时代代码变得方便而易得,我们聊聊思维方式,聊聊烧了4亿 token 之后得到的 5 个教训。
九个旗舰大模型决战中原,究竟谁才能问鼎天下,傲世群雄? 最近vibe coding练手写了个简化版的三国志,并接入LLM让LLM来扮演各个势力的领主,最后的决赛精彩程度远远超出了我的想象。你能猜出谁最后谁赢了吗?
2023年我们开始用 AI 辅助解决问题,2025 年我们验证了 AI Coding 的可行性,2026 年我们决定更进一步——不再让 AI 当"打字员",而是让它当"施工队长"。这篇文章记录了我们团队在 AI Native 研发模式落地过程中的思考、踩坑和最终形成的一套可复制的方法论。