本文介绍 vivo 线下门店「大头贴」拍照合成打印一体化桌面应用软件的技术方案。该项目基于 Tauri 2.0 + Rust + Vue 3 构建,实现了手机实时投屏、智能拍照、Live Photo 处理、模板合成、视频生成、跨平台打印等核心能力,为门店用户提供沉浸式拍照体验。
本文提出"面向Skills编程"范式——将领域知识、工作流、约束规则封装为可版本化的Skills单元,让LLM在确定性框架内生成代码,实现从"人写代码"到"人沉淀Skills,AI写代码"的研发范式升级。以企业购客户对接场景为实战验证,通过项目评估、技术方案、代码生产的研发SOP构建,实现商品域端到端交付周期缩短65%,代码一次生成成功率达90%。
本文将拆解大模型中几个核心操作(RMSNorm、Softmax、Causal Mask、Sampling)背后的数学与 Infra 优化逻辑。看完你会发现,Infra 优化,本质上就是在用数学上的等价变换,或者对精度的适度妥协,去换取更高的硬件利用率和极致的推理速度。PS: 当然最核心的操作肯定是矩阵乘法,这个放到下一篇吧 《AI Infra入门:从矩阵乘法到FlashAttentionV4》~其他的还有RoPE和残差连接没有提及~
Harness Pilot通过将项目规范显式化、版本化并集成到Git工作流,从根本上解决了AI Agent因无法感知隐性规则而导致的协作不可靠问题。其核心在于从依赖AI“自觉”的事后检查,转变为依靠自动化脚本在编码前进行强制预验证的范式,从而确保AI Agent在既定的架构和质量约束内可靠、高效地协作,并将项目知识沉淀为可复用的资产。
这两年随着 AI-Infra 持续升温,云上与云下的 通算与智算服务器 建设节奏明显加快:一方面,服务器数量不断增加,作为核心基础设施承载了海量的训练、推理、Agents和HPC任务;另一方面,围绕服务器引入的部件类型也在持续丰富,新的BMC芯片与固件解决方案、新的BIOS固件解决方案、新款GPU、新款RDMA网卡以及各类板卡控制器。也正因为如此,服务器固件安全问题日益严峻。
AI Coding 的瓶颈正从"模型能力"转移到"流程工程"——模型已经足够聪明,但不稳定,而稳定性必须由外部框架供给。 读完你能带走:一套可抄的 harness 分层结构、一个把"流程当被测对象"的评测方法、4 条用代价换来的踩坑教训,以及一个能迁移到任何 AI 工作流的工程化模式。(文章内容基于作者个人技术实践与独立思考,旨在分享经验,仅代表个人观点。)