近期,得物社区活动「用篮球认识我」推出 “用户上传图片生成专属球星卡” 核心玩法。 初期规划由服务端基于 PAG 技术合成,为了让用户可以更自由的定制专属球星卡,经多端评估后确定:由 H5 端承接 “图片交互调整 - 球星卡生成” 核心链路,支持用户单指拖拽、双指缩放 / 旋转人像,待调整至理想位置后触发合成。而 PAG 作为腾讯自研开源的动效工作流解决方案,凭借跨平台渲染一致性、图层实时编辑、轻量化文件性能,能精准匹配需求,成为本次核心技术选型。 鉴于 H5 端需落地该核心链路,且流程涉及 PAG 技术应用,首先需对 PAG 技术进行深入了解,为后续开发与适配奠定基础。
时光奔流,我们即将与 2025 年挥手作别。感谢这一路上,每一位伙伴的并肩前行与坚定支持。今年,美团技术团队在持续深耕中涌现出不少值得分享的实践与开源产品&服务。我们从中精选了18篇具有代表性的技术文章,内容涵盖大模型开源、研发技能、产品服务三大方向。值得一提的是,美团 LongCat 团队今年在大模型开源领域成果显著,陆续发布了涵盖基座模型、图像、视频、语音等多个方向的开源产品与工具,期望能够持续推动AI技术分享与生态共建。希望这些开源的大模型产品、服务及凝结一线技术实战经验的内容,能为大家带来启发和帮助,陪伴同学们在技术前行的道路上扎实成长。愿我们在新年里,继续向下扎根、向上生长,迎着光,奔赴更高、更远的山海。当然,跟以往一样,文末依然准备了一份小心意,期待你的参与。2026,期待继续同行!
在大模型满天飞的今天,我们是甘心做一个只会调用 OpenAI.chat.completions 的 API 搬运工,还是想真正弄懂那个黑盒子里到底发生了什么?本文将用最朴素的代码,完整的实现一个小型LLM。当你亲手写出 Attention 层的矩阵乘法,亲眼看到模型从输出乱码到学会说话,你会发现:大模型,其实也没那么可怕。
知识库作为IMA的核心功能,合理的架构设计是业务发展的重中之重。本文会分享IMA知识库从0到 1的架构设计,围绕可拓展性、可用性、安全性等方面,分享在构建系统的过程遇到的困难和我们的解决思路。
本文介绍了AI辅助前端动画开发的实践方案与技术思路,核心围绕解决传统动画开发中“参数难获取、沟通成本高、反复返工”等痛点展开。作者以 After Effects(AE)为动效源头,构建了一套基于 MCP(Model Context Protocol)工具链 + Cursor AI IDE 的协作工作流,强调“L3级自动驾驶”——即AI生成关键步骤,但保留开发者随时介入、校验与调整的灵活性。
D是我们团队的服务端应用,其代码库历史悠久,最早可以追溯到淘宝APP无线端迁移,应用中许多代码已无线上流量,但代码并未随业务的下线被清理。越来越多的代码“沉淀”下来,既增加了团队新人学习门槛,也增加日常开发维护成本。但实际做代码下线并非容易,仅凭业务逻辑决策代码清理费时费力,还容易误删在使用的业务代码,因此非常需要工具来辅助做代码的清理,这就是基于代码执行染色和覆盖分析做代码下线方案的背景。代码执行染色&执行覆盖率分析,使用JVM agent的扩展能力实现代码的插桩和在线染色,再通过解析采样的数据可得到代码的执行情况,清理代码就“有理有据”;仅靠原始分析出的数据清理依然低效,为此我们将数据采集、覆盖率可视化通过IDEA插件集成,实现清理无效代码过程又准又快。
近一年,围绕大模型的 Agent 方案呈现井喷态势。从自动化流程、开发辅助,到复杂任务编排,Agent 几乎成为所有 AI 应用的默认形态。 但在实践中,许多系统很快遇到一个共同问题:任务流程越来越复杂,模型的行为却难以预测,失败原因也难以定位。 要理解这一现象,视角需要下沉到 Agent 的底层执行方式。在大多数 Agent 系统中,模型并不是持续自主地完成任务,而是通过一系列推理、行动和反馈来推进流程。 ReAct 范式正是对这一执行过程的抽象总结。它为 Agent 提供了一种清晰、可控的工作链路,使复杂任务能够以结构化的方式逐步完成。 本文将围绕 ReAct 展开,解析其原理、架构设计、适用场景,并结合代码示例说明它在 Agent 系统中的具体实现方式。
想用AI“躺平”批量产出电影级字标和爆款封面?本文将完整复盘我们在好看视频落地 AI视觉生产力的实战路径——涵盖艺术字标体系构建、高点击封面公式提炼,以及从人工提效到平台化自动生产的进阶实践。这不仅是一套提效方案,更是一次关于设计师如何驾驭AI、主导创意生产新范式的探索。
在游戏开发中,大量可探索区域的环境与道具摆放,需要美术与关卡团队反复挑选资产、调整位置、尺度、朝向,并处理“有支撑、无穿插、留通行”等基础约束。这类工作细节密度高、迭代频繁,往往消耗大量制作时间。围绕提升场景制作的稳定性与一致性,腾讯游戏持续探索将AI能力与传统几何、物理工具链结合,在可控、可编辑的制作流程中,为场景搭建提供更稳定的辅助能力与可编辑的布局起点,帮助团队把更多精力投入到核心体验与细节打磨上。需要说明的是,这类能力主要用于研发制作环节:AI输出作为可编辑的候选方案,由美术、策划、程序在工作流中审阅、调整与验收。核心关卡、关键镜头与高关注区域仍以专业美术的创作与精细打磨为主;AI更适合用于过渡区域、边缘区域与远景背景等非核心但必须覆盖的部分(这些区域往往没有过多的艺术家的创作空间深度、自由度,美术做起来也非常痛苦、机械),在叙事合理性、资产风格一致性与基础空间美学、物理约束上提供辅助,减少PCG规则带来的重复、穿帮感,让游戏团队把宝贵的手工精力集中投入到玩家最在意的体验与细节上。