作为一名高德打车的区域运营同学,和常规运营同学一样,日常工作中需要大量时间和精力在盯数据、写日报、做分析上。半年前,我对"CI/CD"这个词一无所知,甚至不理解代码库、git存在的意义——认为那些都是开发同学才需要懂的东西。但现在,我独立搭建了一套完整的日报自动化流水线:每天定时从ODPS取数、用Qwen大模型生成日报解读、自动推送钉钉群、自动部署到在线站点。整个流程无需人工干预,从数据到阅读只需要10分钟。这篇文章不是技术科普,而是一个运营视角的真实实战记录——我是怎么从零开始,一步步踩坑、一步步用AI解决技术问题,最终把整套系统跑起来的。
上篇《AI 动画辅助实现的方案与实践》介绍了用 AI 辅助前端手写动画的思路与实践。本篇进一步介绍我们落地的全链路方案:设计师在 AE 中完成动画制作后,通过插件实时预览转码效果,确认无误后直接导出前端可用代码,前端在 IDE 中集成即可使用。该方案将传统交付流程从「AE → Lottie/视频 → 前端手写代码」简化为「AE 插件直出代码」,大幅提升了动画开发的效率和还原度。
由支付宝体验技术部开源的 UI-UX 用户体验大模型,致力于识别「弹窗遮挡、布局错乱、货品展示与承诺不一致」等违背用户认知习惯的 UX 缺陷问题。此类缺陷长期依赖人工走查排查,存在成本高、效率低、易遗漏的痛点。该模型仅以 4B 参数量,在自建评测基准 UXBench 上取得 0.7963 的 SOTA 成绩,超越 Claude Opus 4.8、Kimi 2.6 等 2026 年最新旗舰模型,让多模态大模型能够像资深产品经理一样——看一眼截图即可完成 UX 诊断。
过去两年,AI Coding 从"能写出能跑的代码"走到"能放手让它写一整段功能"。但把这个能力放进真实业务、放进多人协作、放进存量系统里跑时我们发现一件怪事——AI 写得越快,整体节奏并没有同步加快。盘点下来,单看"AI 写出来的代码占比"这个数字一路走高,可真正落到版本节奏上,提效却远没有这个数字好看。出码率和提效之间,裂开了一道缝。从 OpenAI Codex 团队那篇 Harness 工程博客里反复强调的一个观察——"早期进展比预期慢,并不是因为 Codex 不具备相应的能力,而是因为环境的规范不够明确"——开始,整个行业都在补同一件事:给模型搭一套能稳定干活的"工作环境"。这一层最近被业界命名为 Harness Engineering——它不是教模型怎么回答,而是设计模型怎么工作。 在这里,也分享下我们的探索之旅,是踩过的坑、做过的取舍、和到现在还没解决的问题。
为什么 Prompt 写得再细,AI 还是会输出奇怪的结果?为什么新项目 AI 很好用,历史业务却总是翻车?本文作者从信息论出发,用一个简单的框架帮你拆解 AI Coding 里的种种困惑——当你不再跟着新概念焦虑,而是回到"信息"和"不确定性"的底层逻辑,很多问题会清晰得多。
「得物推荐 AI Harness 工程化实践系列」的开篇内容,本系列共三篇连载。将系统拆解得物推荐复杂业务场景下,AI代码从生成、防护校验到安全上线的完整技术体系,逐一详解自研AI Harness整体架构框架、全流程安全防护机制、混合智能体核心算法实现,以及工业级工程落地的实战细节。 本篇(上篇):将整体介绍团队自研的AI Harness体系,包括建设思路、全生命周期防护机制、混合智能体架构及落地效果。
OpenSandbox 是一个阿里巴巴开源的面向 AI Agent 的通用沙箱平台,提供多语言 SDK、CLI、MCP Server,以及 Docker / Kubernetes 运行时,在阿里内部广泛应用于 Coding Agent、GUI Agent、代码执行、Agent 评测、RL 训练等场景。OpenSandbox 正在成为 AI Agent 基础设施领域里一个重要的开源项目。随着 AI Agent 从 Demo 走向生产环境,沙箱要解决的问题也不再只是“代码在哪里执行”,还包括“真实凭据应该如何安全使用”。这就是 Credential Vault 要解决的问题:让工具照常工作,但让真实密钥不再进入沙箱。
当 Agent 技术彻底跨越 Demo 玩具阶段,真正挺进千万级并发的企业级生产环境时,传统的 ReAct 架构开始暴露出节点臃肿、延迟极高、状态管理混乱的致命缺陷。本文深度拆解火山引擎 AI 搜索团队如何重新定义 Workflow 与 Agent 的系统边界,通过构建 Unified Policy Agent (UP-ReAct) 架构,在实现推荐与对话效果大幅提升的同时,将首字返回时间(TTFT)暴降 30%。这不仅是一次代码重构,更是对工业级 Agent 设计哲学的底层重塑。
本文将从算子优化与融合、并行策略、多级缓存、MTP和异步调度优化、量化与稀疏五大维度,逐一剖析各项技术的设计思路、核心算法与实测收益,全面揭示 Hy3 preview 模型在 Hopper 卡上从算子到系统的极致性能优化实践。