此前已有不少文章围绕 Agent 自进化这个主题展开过讨论,内容涵盖了 Hermes Agent 等自进化框架,以及 Skill 自进化等具体技术方向。而最近,AI 领域又出现一个新的概念,叫做 Loop(循环)或者叫 Loop Engineering(中文翻译一般叫“循环工程”)。因此,本文将重点聊聊这个话题,尽量系统化地介绍一下 Loop 与 Loop Engineering 究竟是什么,以及它们背后有哪些思考。
本文介绍 vivo 线下门店「大头贴」拍照合成打印一体化桌面应用软件的技术方案。该项目基于 Tauri 2.0 + Rust + Vue 3 构建,实现了手机实时投屏、智能拍照、Live Photo 处理、模板合成、视频生成、跨平台打印等核心能力,为门店用户提供沉浸式拍照体验。
本文提出"面向Skills编程"范式——将领域知识、工作流、约束规则封装为可版本化的Skills单元,让LLM在确定性框架内生成代码,实现从"人写代码"到"人沉淀Skills,AI写代码"的研发范式升级。以企业购客户对接场景为实战验证,通过项目评估、技术方案、代码生产的研发SOP构建,实现商品域端到端交付周期缩短65%,代码一次生成成功率达90%。
本文将拆解大模型中几个核心操作(RMSNorm、Softmax、Causal Mask、Sampling)背后的数学与 Infra 优化逻辑。看完你会发现,Infra 优化,本质上就是在用数学上的等价变换,或者对精度的适度妥协,去换取更高的硬件利用率和极致的推理速度。PS: 当然最核心的操作肯定是矩阵乘法,这个放到下一篇吧 《AI Infra入门:从矩阵乘法到FlashAttentionV4》~其他的还有RoPE和残差连接没有提及~
Harness Pilot通过将项目规范显式化、版本化并集成到Git工作流,从根本上解决了AI Agent因无法感知隐性规则而导致的协作不可靠问题。其核心在于从依赖AI“自觉”的事后检查,转变为依靠自动化脚本在编码前进行强制预验证的范式,从而确保AI Agent在既定的架构和质量约束内可靠、高效地协作,并将项目知识沉淀为可复用的资产。
这两年随着 AI-Infra 持续升温,云上与云下的 通算与智算服务器 建设节奏明显加快:一方面,服务器数量不断增加,作为核心基础设施承载了海量的训练、推理、Agents和HPC任务;另一方面,围绕服务器引入的部件类型也在持续丰富,新的BMC芯片与固件解决方案、新的BIOS固件解决方案、新款GPU、新款RDMA网卡以及各类板卡控制器。也正因为如此,服务器固件安全问题日益严峻。